第三次作业介绍

一、作业要求

  1. 按照课堂内容,修改倒排索引表,实现静态存储、模糊查询、返回词语所在句子。
  2. 使用MapReduce的知识,修改代码实现Map和Reduce的过程(在自己电脑上模拟即可,假设此时有五个MapReduce可以工作),并将文件以静态形式存储,对比该方法与之前存储方式优缺点
  3. 压缩倒排索引表,比较压缩前后的文件大小以及程序运行速度
  4. 在查询的同时,给查询文档进行评分并将结果排序输出

到现在,你的查询系统已经比较完整啦,可以自己思考还有哪些地方可以改进,下次作业将更多侧重DIY设计。

二、提交方式

提交至邮箱2631403308@qq.com,要求提交完整讲解视频(不用打成压缩包,讲解内容应同课堂展示,视频大小尽量控制在30M内)

ddl:11.15 晚24:00

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注

滚动至顶部