可爱的python一道习题,2.读取某一简单索引文件cdays-3-test.txt,其每行格式为文档序号 关键词,现需根据这些信息转化为倒排索引,即统计关键词在哪些文档中,格式如下:包含该关键词的文档数 关
来源:学生作业帮助网 编辑:作业帮 时间:2024/06/25 18:43:07
![可爱的python一道习题,2.读取某一简单索引文件cdays-3-test.txt,其每行格式为文档序号 关键词,现需根据这些信息转化为倒排索引,即统计关键词在哪些文档中,格式如下:包含该关键词的文档数 关](/uploads/image/z/13590557-53-7.jpg?t=%E5%8F%AF%E7%88%B1%E7%9A%84python%E4%B8%80%E9%81%93%E4%B9%A0%E9%A2%98%2C2.%E8%AF%BB%E5%8F%96%E6%9F%90%E4%B8%80%E7%AE%80%E5%8D%95%E7%B4%A2%E5%BC%95%E6%96%87%E4%BB%B6cdays-3-test.txt%2C%E5%85%B6%E6%AF%8F%E8%A1%8C%E6%A0%BC%E5%BC%8F%E4%B8%BA%E6%96%87%E6%A1%A3%E5%BA%8F%E5%8F%B7+%E5%85%B3%E9%94%AE%E8%AF%8D%2C%E7%8E%B0%E9%9C%80%E6%A0%B9%E6%8D%AE%E8%BF%99%E4%BA%9B%E4%BF%A1%E6%81%AF%E8%BD%AC%E5%8C%96%E4%B8%BA%E5%80%92%E6%8E%92%E7%B4%A2%E5%BC%95%2C%E5%8D%B3%E7%BB%9F%E8%AE%A1%E5%85%B3%E9%94%AE%E8%AF%8D%E5%9C%A8%E5%93%AA%E4%BA%9B%E6%96%87%E6%A1%A3%E4%B8%AD%2C%E6%A0%BC%E5%BC%8F%E5%A6%82%E4%B8%8B%EF%BC%9A%E5%8C%85%E5%90%AB%E8%AF%A5%E5%85%B3%E9%94%AE%E8%AF%8D%E7%9A%84%E6%96%87%E6%A1%A3%E6%95%B0+%E5%85%B3)
可爱的python一道习题,2.读取某一简单索引文件cdays-3-test.txt,其每行格式为文档序号 关键词,现需根据这些信息转化为倒排索引,即统计关键词在哪些文档中,格式如下:包含该关键词的文档数 关
可爱的python一道习题,
2.读取某一简单索引文件cdays-3-test.txt,其每行格式为文档序号 关键词,现需根据这些信息转化为倒排索引,即统计关键词在哪些文档中,格式如下:包含该关键词的文档数 关键词 => 文档序号.其中,原索引文件作为命令行参数传入主程序,并设计一个collect函式统计 "关键字序号" 结果对,最后在主程序中输出结果至屏幕.
cdays-3-test.txt 内容:
1 key1
2 key2
3 key1
7 key3
8 key2
10 key1
14 key2
19 key4
20 key1
30 key3
主要想看的是结果怎么出来的,如果你直接找答案过来粘贴的,就不用了,要真实操作的截图,
我的报错
Traceback (most recent call last):
File "D:\python\ly\src\supercat\���.py",line 26,in
result = collect(open('D:\python\huge.txt','r')) #调用collect函式,返回结果
File "D:\python\ly\src\supercat\���.py",line 15,in collect
left,right = line.split() #将一行以空格分割为左右两部分
ValueError:need more than 0 values to unpack
可爱的python一道习题,2.读取某一简单索引文件cdays-3-test.txt,其每行格式为文档序号 关键词,现需根据这些信息转化为倒排索引,即统计关键词在哪些文档中,格式如下:包含该关键词的文档数 关
原因是你的"cdays-3-test.txt"文件里有空行,可以在"left,right = line.split()"之前先判断并跳过空行;
还有一个方案是用正则表达式进行信息提取解析.