Crawler：基于BeautifulSoup库+requests库实现爬取2018最新电影《后来的我们》热门短评-重庆市软件正版化服务平台

政策资讯

Policy Information

Crawler：基于BeautifulSoup库+requests库实现爬取2018最新电影《后来的我们》热门短评

来源：重庆市软件正版化服务中心 | 时间： 2022-09-20 | 浏览量： 68135 |

Crawler：基于BeautifulSoup库+requests库实现爬取2018最新电影《后来的我们》热门短评

输出结果

实现代码

输出结果

实现代码


 -*- coding: utf-8 -*-
 
Py之Crawler：利用BeautifulSoup库实现爬取2018最新电影《后来的我们》热门短评
import time
import requests
import csv
from bs4 import BeautifulSoup
head = 'https://movie.douban.com/subject/'
middle = '/comments?start='
zr_tail = '&limit=20&sort=new_score&status=P&percent_type='
names = []
header = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 SE 2.X MetaSr 1.0'
}
 
zr_urls = ['最热'] 
def createUrls(): 
   for j in range(1, 34, 2): 
       name = names[j]
       print(name)
       for i in range(0, 100, 20):
           zr_urls.append(head + str(name) + middle + str(i) + zr_tail) 
           print(zr_urls)得到某个电影短评地址(默认最热排序)，如https://movie.douban.com/subject/27063335/comments?start=0&limit=20&sort=new_score&status=P&percent_type=
 
def readName(): 
   with open('爬取电影名称.txt', mode='r', encoding='utf-8') as f:
       for i in f.readlines():
           i = i.strip('\n')
           names.append(i)
           print(names)  
readName()
createUrls()
get_comments(zr_urls)  传入zr_urls

完整代码，后续一周内即将公布！

文章知识点与官方知识档案匹配，可进一步学习相关知识

Python入门技能树网络爬虫Beautiful Soup123871 人正在系统学习中

产品推荐

更多 >

WPS 365 一站式数字办公套件

WPS 365是金山办公推出的“数字办公全家桶”、一站式数字办公套件。既包含WPS Office套装、云盘、在线文档、轻维表、表单、脑图等内容创作工具，也包含企业IM、音视频会议等协作软件，助力企业高效协同办公。 2023年4月1日，金山办公宣布旗下全新产品WPS 365正式上线。通过统一工具、统一协作、统一管理的数字办公理念匹配业务发展，实现整个组织高效协作和安全管控。

1条评论

万里安全数据库V1.0

万里安全数据库GreatDB V1.0产品通过中国信息安全测评中心第一批“安可”测评，是“国货国用”、国资委79号文要求2027年全面完成国产替代的国产数据库厂商，也是入围国家信创目录中唯一采用 MySQL 技术路线的国产数据库厂商。

0条评论

中望CAD平台软件V2025 国产正版制图软件

中望软件是可信赖的All-in-One CAx解决方案提供商,科创板上市企业,掌握二三维CAD、CAM、CAE核心技术及产品开发能力,产品有中望CAD,中望3D,中望电磁,中望结构仿真.提供建筑设计软件与机械设计制图软件。

0条评论

金山终端安全系统V9.0杀毒软件（防病毒+漏洞+优化等）

金山终端安全系统V9.0是专门为政府、军工、能源、教育、医疗及集团化企业设计的终端安全管理平台。

0条评论