视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
网页正文信息一般存储在哪里_html/css_WEB-ITnose
2020-11-27 15:50:23 责编:小采
文档


毕业设计的题目是基于统计的网页正文信息抽取,因次需要知道一般的网页都把正文信息放在什么组件里面啊


回复讨论(解决方案)

呵呵
这个不好说 反正在body里面
哈哈

呵呵
这个不好说 反正在body里面
哈哈
看到一篇论文说一般是放在table里的

table是表格,以前做网页一般都是用表格来做排版和放置正文,现在很多网站都是用DIV+CSS的形式来,那么文字就可能是放在DIV中,而并非表格

也可以放在数据库里面,更新,维护容易

感觉说得比较模糊...有两种可能:1,是显示的正文,这里当然是指和

之间的内容,2,网页正文,即组成该网页的所以内容,也即和之间的内容(前面那句代码估计也是吧?不清楚),这好象是网络爬虫搜索的内容,根据你的题目(基于统计的网页正文信息抽取)估计是通过提取web页面内容然后搜索指定内容进行统计...所以应该上第二种情况...呵呵

这要“具体网站具体分析”了吧,有的网站主要数据内容是在table中,有的却可能在div,甚至dl、ol、ul中。

放在html里呵呵,中

放在里




这不都扯淡的么

爱放哪儿就放哪儿

引用 1 楼 xming4321 的回复:
呵呵
这个不好说 反正在body里面
哈哈

看到一篇论文说一般是放在table里的
一般正文信息在段落

中,因为

才是符合标准的终端块状元素,
现在的网页都用div css进行排版,
所以放在

中的都是些存在纵横表格式关系的数据信息。

毕业设计的题目是基于统计的网页正文信息抽取,因次需要知道一般的网页都把正文信息放在什么组件里面啊
请问楼主的正文抽取程序搞定了吗 能不能发我一份参考一下 非常感谢!!

下载本文
显示全文
专题