18910140161

Python-试图刮雅虎财经"世界指数"列表-堆栈溢出

顺晟科技

2022-10-18 13:11:47

86

我正在努力搜集“世界指数”。列表从雅虎财经(https://finance.yahoo.com/world-indices/)到一个数据帧使用下面的代码。但是,当我收到以下内容时:

ValueError:找不到表

import pandas as pd
major_indices = pd.read_html("https://finance.yahoo.com/world-indices/")
df = pd.read_html(driver.find_element_by_id("history_table").get_attribute('outerHTML'))[0]
df.head()

Output:
ValueError: No tables found

我试着检查页面,发现表格周围

<代码><;tbody data-reactid=";36";>;..<;/t正文>;。

我试图搜索如何进行刮擦,但没有任何运气。

Pandas DataReader是未来的发展方向吗?有没有一个更强大的网络刮刀我应该使用,如硒或美丽的汤?


顺晟科技:

我建议使用Python研究BeautifulSoup的Web抓取功能。如果您使用像PyCharm这样的IDE,那么使用BeautifulSoup对象来查找网页的内容应该不会太困难。

这是你的例子的开始。


<tbody data-reactid="36"> ... </tbody>. 
  • TAG:
相关文章
我们已经准备好了,你呢?
2024我们与您携手共赢,为您的企业形象保驾护航