版权说明
操作指南
首页
成果
学者
院系
首页
>
成果
>
详情
基于Heritrix的网络主题爬虫算法研究与应用——以粮食网站交易信息为例
认领
导出
Link by 中国知网学术期刊
Link by 万方学术期刊
反馈
分享
QQ
微信
微博
作者信息
关键词
期刊信息
基础信息
归属信息
摘要
成果类型:
期刊论文
作者:
樊多妮;李禹生
作者机构:
武汉工业学院数学与计算机学院,湖北 武汉 430023
语种:
中文
关键词:
网络爬虫;向量空间模型;匹配算法
关键词(英文):
Heritrix
期刊:
现代物业(上旬刊)
ISSN:
1671-8089
年:
2012
期:
09
页码:
97-100
DOI:
10.16141/j.cnki.xdwyxjs.2012.09.029
基金类别:
项目名称:湖北省教育厅科研项目“基于语义网的半结构化信息抽取技术及其应用研究”。项目编号:D200618003;
机构署名:
本校为第一机构
院系归属:
数学与计算机学院
摘要:
首先对搜索引擎中的主题网络爬虫进行介绍,以Java开源网络爬虫Heritrix为基础,阐述其工作原理及架构.在此基础上通过Internet粮食交易信息网站与爬虫的自动采集技术相结合展开对该领域主题网络爬虫开发的研究.
反馈
产权有误:本人成果被他人认领
数据有误:数据基本信息有误
归属有误:成果的院系归属、机构署名归属有误
其他原因:
验证码:
看不清楚,换一个
确定
取消
成果认领
标题:
用户
作者
通讯作者
--
请选择
请选择
--
确定
取消
提示
该栏目需要登录且有访问权限才可以访问
如果您有访问权限,请直接
登录访问
如果您没有访问权限,请
联系管理员
申请开通
管理员联系邮箱:
yun@hnwdkj.com