-
Notifications
You must be signed in to change notification settings - Fork 207
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
有关item_index2entity_id_rehashed.txt和kg_rehashed.txt的问题 #17
Comments
您好,第一列是head id,包括的item不只是电影。超过电影数目的电影ID是因为,我们不止抓取了item中匹配到的电影的信息,也做了多跳的扩展,所以在它们的多跳邻居中可能有其它电影,这些电影的信息也被存储了起来。谢谢! |
谢谢教授的解答!我还有些疑问。原始评分数据ratings.dat中总共有3952部电影,item_index2entity_id_rehashed.txt中只对其中的2445部电影进行重新编号,这些电影是如何挑选出来的呢,对这些电影重新标号的作用是什么呢?kg_part1_rehashed.txt和kg_part2_rehashed.txt文件中,第一列中数值小于2445的head_id是否对应item_index2entity_id_rehashed.txt中的第二列数值呢?感谢并期待您的回复。 |
因为在知识图谱中只能匹配到这么多电影。重新标号是把两边的ID给对应上。是的。 |
王教授您好,我还有两个问题想问您: |
您好,一跳的三元组是这样的,二跳的不好说,但是数据集中应该没有头尾都是电影的三元组。 |
应该是第一列中数值小于第2445行第一列的值吧 |
您好,还想问下有关知识图谱的构建问题,我有点不太明白的是三元组的头节点和尾节点是如何确定的。我注意到ripplenet模型框架图中,与seed节点形成三元组的节点并非都是以seed节点为头节点的,这张图只是举例吗,还是实际中确实有这样的情况?我的疑问是右侧的seed为什么是它右侧节点的尾节点,而不是头节点呢?是所有的用户共用一张所有节点和方向都相同的图谱吗?还是说每个用户都有各自的图谱,用户间的图谱的节点和方向未必相同? |
您好,没有太明白您的问题,知识图谱是这样构建的,以seed nodes(就是item nodes)为核心,按照一个给定的关系集合来向外扩展知识图谱。也就是说,扩展的时候只考虑预先给定的那些关系,这样来控制知识图谱的大小。至于后续加入的节点是不是在seed nodes中,并没有限制。 |
王教授您好,冒昧的打扰您,想问您一下一些数据的具体含义。以movie数据为例,data文件夹中,ratings.dat是原始评分数据,给出了6040位用户对3952部电影的评分;item_index2entity_id_rehashed.txt是对其中2347部电影的重新编号;那么kg_part1_rehashed.txt和kg_part2_rehashed.txt文件中,第一列数据代表什么含义呢?我看这两个文件第一列中,存在超过电影数目的数字,而对应的relation中是以film开头,有些想不明白,想了解一下第一列数据的具体含义。感谢并期待您的回复。
The text was updated successfully, but these errors were encountered: