准备做一个收集马蜂窝中游记的爬虫,收集一个地点的所有游记 的文字内容,然后通过对文字内容进行语义情感分析,得出各个 地点的好感程度,关键字等内容。 抓取内容为马蜂窝游记页面的内容。先通过城市页面,使用游记的ajax接口,获取所有游记的链接 ...
本项目封装了一套可用于爬取JM的Python API. 你可以通过简单的几行Python代码,实现下载JM上的本子到本地,并且是处理好的图片。 本项目的核心功能是下载本子。 基于此,设计了一套方便使用、便于扩展,能满足一些特殊下载需求的框架。 目前核心功能实现较为 ...