Python爬取猫眼「碟中谍」全部评论

  • 时间:
  • 浏览:0

请求地址中的参数:

猫眼PC网页能能查看热门评论,能能在手机端页面能能查看完整版评论。许多人用chrome手机模式打开碟中谍6的页面,而且找到了完整版评论入口:

虽然正常来说到这儿就差太少了,按照以往的套路循环传入offset参数就好了,不过当我爬到第67页的前一天,就而且不返回值了,怎么么会是67,6715=50005,猫眼应该是控制了每个startTime能能往前取50000条评论,什么都有能能换个思路,将每页最早一条评论的时间作为startTime传入,offset固定15就好了。

评论算保存完了,近期会再做有另一一两个关于此次数据的可视化分析。另外阿汤哥真心太帅了,全程打肾上腺素,各位还没去看的赶紧~

最后效果

当许多人将评论页面向上拖,后台请求中变看得人了许多人愿意的接口地址:http://m.maoyan.com/mmdb/comments/movie/341737.json?_v_=yes&offset=15&startTime=2018-09-02%2013%3A33%3A14

skr~skr~~

昨天晚上看得人碟中谍后,有点硬小激动,而且不是了这片文章。

许多人将猫眼上碟中谍的完整版评论保存下来,用于后期分析~

总共评论3W条左右。