版权说明 操作指南
首页 > 成果 > 详情

Web Page Data Collection Based on Multithread

认领
导出
Link by 万方会议论文
反馈
分享
QQ微信 微博
成果类型:
期刊论文、会议论文
作者:
Wentao Liu
通讯作者:
Liu, W.(uddisoap@gmail.com)
作者机构:
[Liu W.T.] School of Mathematic and Computer Science, Wuhan Polytechnic University, Wuhan Hubei Province 430023, China
通讯机构:
[Liu, W.] S
School of Mathematic and Computer Science, , Wuhan Hubei Province 430023, China
语种:
英文
关键词:
Data collection;Multithread;Web page
期刊:
Applied Mechanics and Materials
ISSN:
1660-9336
年:
2013
卷:
347-350
页码:
2575-2579
会议名称:
2013 2nd International Conference on Computer Science and Electronics Engineering(ICCSEE2013)(2013年第二届计算机科学与电子工程国际会议)
会议论文集名称:
2013 2nd International Conference on Computer Science and Electronics Engineering(ICCSEE2013)(2013年第二届计算机科学与电子工程国际会议)论文集
会议时间:
2013-03-22
会议地点:
杭州
会议赞助商:
计算机科学与电子技术国际学会
机构署名:
本校为第一机构
院系归属:
数学与计算机学院
摘要:
The web data collection is the process of collecting the semi-structured, large-scale and redundant data which include web content, web structure and web usage in the web by the crawler and it is often used for the information extraction, information retrieval, search engine and web data mining. In this paper, the web data collection principle is introduced and some related topics are discussed such as page download, coding problem, updated strategy, static and dynamic page. The multithread technology is described and multithread mode for the web data collection is proposed. The web data colle...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com