博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Daily Scrum 2012/11/01
阅读量:4975 次
发布时间:2019-06-12

本文共 816 字,大约阅读时间需要 2 分钟。

@TeamSH-IT

讨论中提出的一些问题及解决方法:

  问题:Hu Renjun要先实现了一个简单的问答去重,但是没有数据来测试呀!而且我们在开发的过程中,爬虫组并不会提供他们爬取的结果,那我们的测试数据怎么搞定?

  小组讨论结果:HRJ如果需要可以自己手动去搜集几个数据,在Lian Zhaopeng 和 Li Bin开发的功能实现后,我们应当收集一些数据并存入数据库中,方便系统整体的调试和以后的功能演示。

  问题:譬如百度知道等问答网站,一个问题可能拥有很多回答,需要保存多种回答么?

  小组讨论结果:暂时只保存一种,在信息抽取部分要尽量抽最佳的回答。

详细的完成情况:

组员 今天任务 明天任务
Hu Renjun

任务84 数据处理——整合

搜集几个Key Data 实现去重功能         

任务84 数据处理——整合

收集 整理一些Key Data

调试去重功能,并完善        

Peng Xiaodong              

任务68 前期UI设计 

完成界面小样

 逐步完善

 任务68 前期UI设计

 完善UI

 自己做测试数据 

Lian Zhaopeng

任务82 数据处理——去噪

 在明确要求的基础上开始构思算法如果时间还很多的话可以开始初步的写代码

 

 明确算法之后查询关于用c#解析htm的资料

Li bin

 任务83 数据处理——抽取有用信息

上网查有关抽取信息的资料

 任务83 数据处理——抽取有用信息

考虑算法

Sui Yuhao

任务67 定义数据格式

 阅读有关Content schema definition &  Content Pipeline的内容

 熟悉数据库操作

任务67 定义数据格式

在My SQL里建立所需的表,了解Crawler原理 

 

Born Down 图:

 

感觉和昨天的没啥区别!!

转载于:https://www.cnblogs.com/teamshit/archive/2012/11/01/2750488.html

你可能感兴趣的文章
BNUOJ 5629 胜利大逃亡(续)
查看>>
HDU-1150 Machine Schedule(二分图、匈牙利)
查看>>
Python assert 断言函数
查看>>
35)PHP,关于PHP和html
查看>>
区块链到底是什么?
查看>>
二分图判定 hdu5285 wyh2000 and pupil
查看>>
VS 2013 配置份openGL环境
查看>>
修改 CKEditor 超链接的默认协议
查看>>
zoj3795 Grouping --- 良好的沟通,寻找最长的公路
查看>>
【SSH2(理论+实践)】--Hibernate步步(一个)
查看>>
深入浅出JMS(一)——JMS简要
查看>>
JDBC连接MySQL数据库及演示样例
查看>>
小波说雨燕 第三季 构建 swift UI 之 UI组件集-视图集(四)Alert View视图 学习笔记...
查看>>
百度SDK的使用第一天
查看>>
bzoj3156 防御准备
查看>>
XE7/X10.2 Datasnap使用 dbExpress 连接MySQL数据库
查看>>
Eclipse修改编码格式
查看>>
生成器和协程 —— 你想知道的都在这里了
查看>>
初级算法-6.两个数组的交集 II
查看>>
欧拉函数 / 蒙哥马利快速幂 / 容斥
查看>>