PHP-抓取信息后如何自动化处理分类?

PHP-抓取信息后如何自动化处理分类?

清晨说ぺ晚安 发布于 2017-08-21 字数 517 浏览 1222 回复 2

现在要做一个类似团购导航的应用,抓取过来这些信息之后,如何让其自动化分类呢?比如“餐饮”、“娱乐”。。。等等

有什么设计思路?

帮助完善(@Allo):可能@叶雨的意思是:自己的网站会有一套分类,每个团购网站又有自己的分类,分类的名字可能会不一样,比如美团有个分类是“美容保健”,自己的网站分类可能叫“美容健身”。如何将抓取来的内容自动归类到自己的分类下

如果你对这篇文章有疑问,欢迎到本站 社区 发帖提问或使用手Q扫描下方二维码加群参与讨论,获取更多帮助。

扫码加入群聊

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

浮生未歇 2017-10-21 2 楼

说下思路:
1. 自定义好分类,每个分类对应一些关键字,每个关键字属于这个分类有个权重。
2. 然后计算分类的权重,决定该条目属于哪个分类。

归属感 2017-09-29 1 楼

理论上是可以用语义去分析页面并且归类,但是总会有误差,比较保守的方法是:建立两个数据表

一个表存储抓取目标网站的所有分类。

另一个表存储目标网站分类与自己网站分类的对应关系。

然后在后台人工建立对应关系即可,一般来说网站的分类不会轻易改变,所以花一些时间建立对应关系后可以一劳永逸。