Skip to content

关于特征工程的做法 #10

@yuqing-liu-dut

Description

@yuqing-liu-dut

您好!很荣幸看到您的代码,然而在训练我们的数据集时遇到了一些问题。
问题1:特征工程
关于特征的编码,我们比较好奇是使用什么样的方式。如果可以的话,能请您发一下对criteo数据集进行特征编码的代码或链接吗?
问题2:标签编码
在阅读代码的过程中,我发现在读取数据时,index是对应的Xi_train内容,是读取的csv中的数据。而value是1-39的标签。这让我有些费解。如果可以的话,能请您大概描述一下这么做的原因吗?或者请您简单介绍一下embed标签的csv中每一列代表的意义吗?

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions