版权说明 操作指南
首页 > 成果 > 详情

基于Heritrix的网络主题爬虫算法研究与应用——以粮食网站交易信息为例

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
樊多妮;李禹生
作者机构:
武汉工业学院数学与计算机学院,湖北 武汉 430023
语种:
中文
关键词:
网络爬虫;向量空间模型;匹配算法
关键词(英文):
Heritrix
期刊:
现代物业(上旬刊)
ISSN:
1671-8089
年:
2012
期:
09
页码:
97-100
基金类别:
项目名称:湖北省教育厅科研项目“基于语义网的半结构化信息抽取技术及其应用研究”。项目编号:D200618003;
机构署名:
本校为第一机构
院系归属:
数学与计算机学院
摘要:
首先对搜索引擎中的主题网络爬虫进行介绍,以Java开源网络爬虫Heritrix为基础,阐述其工作原理及架构.在此基础上通过Internet粮食交易信息网站与爬虫的自动采集技术相结合展开对该领域主题网络爬虫开发的研究.

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com