您的位置: 首页 > 新闻资讯 > 正文

代理IP如何帮助爬虫爬取猫眼电影影片?

发布时间:2019-05-08 17:27:42 来源:互联网

代理IP如何帮助爬虫爬取猫眼电影影片?想要获取最近热映影片,当然是用爬虫来爬取。今天我们就来看下,爬虫是如何爬取猫眼电影热映影片信息的。首先我们先打开猫眼电影的热映榜单页面,右键检查分析页面,查找目标信息位置。


代理IP如何帮助爬虫爬取猫眼电影影片?


具体代码如下:

import requests

import re

url = 'http://maoyan.com/board'

headers = {'User-Agent': '具体agent信息'}

response = requests.get(url, headers=headers)

pattern = re.compile(r'

  • ([\d\D]*?)

  • ')  # 只显示一个

dd_list = pattern.findall(response.text)

for dd in dd_list:

#  电影名字

title_pattern = re.compile(r'(.*?)')

name = title_pattern.findall(dd)

print(name[0].strip())

#  电影主演

people_pattern = re.compile(r'

([\d\D]*?)

')

people = people_pattern.findall(dd)

print(people[0].strip())

#  上映时间

time_pattern = re.compile(r'

([\d\D]*?)

')

time = time_pattern.findall(dd)

print(time[0])

#  评分

score_pattern1 = re.compile(r'([\d\D]*?)')

score_first = score_pattern1.findall(dd)[0]

score_pattern2 = re.compile(r'([\d\D]*?)')

score_last = score_pattern2.findall(dd)[0]

print(score_first + score_last)

通过上述代码,我们就可以获取到猫眼电影热映影片的电影名字、主演、上映时间和评分信息了。黑洞代理服务器爬虫代理,数据采集服务服务提供商,为您提供更快,更可靠的服务。


相关文章内容简介

1 代理IP如何帮助爬虫爬取猫眼电影影片?

  代理IP如何帮助爬虫爬取猫眼电影影片?想要获取最近热映影片,当然是用爬虫来爬取。今天我们就来看下,爬虫是如何爬取猫眼电影热映影片信息的。首先我们先打开猫眼电影的热映榜单页面,右键检查分析页面,查找目标信息位置。  具体代码如下:  import∵requests  import∵re  url∵=∵'http://maoyan.com/board'  headers∵=∵{'User-Agent':... [阅读全文]

最新标签