已解决IndexError: list index out of range

已解决(Python爬虫遍历列表报错)IndexError: list index out of range









报错代码



粉丝群里面的一个小伙伴想用requests爬虫,然后遍历Xpath定位的数据列表的时候,发生了报错(当时他心里瞬间凉了一大截,跑来找我求助,然后顺利帮助他解决了,顺便记录一下希望可以帮助到更多遇到这个bug不会解决的小伙伴),报错代码如下:

import requests
from lxml import etree

text = requests.get("https://www.baidu.com").content.decode()


html = etree.HTML(text)

div_divst = html.xpath("//div")
for div in div_divst:
    title = div.xpath("@title")[0]
    url = div.xpath("@url")[0]


报错信息如下

IndexError: list index out of range



报错翻译



报错信息翻译

索引错误:列表索引超出范围





报错原因



list index out of range错误出现的原因主要有两个:

  • 一个可能是下标超出范围
  • 一个可能是list是空的,没有一个元素

粉丝的爬虫代码中明显是因为Xpath没有定位到数据,所以list为空,list[0]就会报错。小伙伴们按下面的方法解决即可!!!





解决方法



用异常捕获Xpath定位,当报错的时候捕获异常并把title和url赋值为None:

import requests
from lxml import etree

text = requests.get("https://www.baidu.com").content.decode()

html = etree.HTML(text)

div_divst = html.xpath("//div")
for div in div_divst:
    try:
        title = div.xpath("@title")[0]
        url = div.xpath("@url")[0]
    except:
        title = None
        url = None


帮忙解决

本文已收录于:《告别Bug》专栏

本专栏用于记录学习和工作中遇到的各种疑难Bug问题,以及粉丝群里小伙伴提出的各种问题,文章形式:报错代码 + 报错翻译 + 报错原因 + 解决方法,包括程序安装、运行程序过程中等等问题,订阅专栏+关注博主后如遇到其他问题可私聊帮忙解决!!!

文章出处登录后可见!

已经登录?立即刷新

共计人评分,平均

到目前为止还没有投票!成为第一位评论此文章。

(0)
心中带点小风骚的头像心中带点小风骚普通用户
上一篇 2023年3月5日
下一篇 2023年3月5日

相关推荐