Python-试图刮雅虎财经&quot；世界指数&quot；列表-堆栈溢出

顺晟科技

2022-10-18 13:11:47

我正在努力搜集“世界指数”。列表从雅虎财经（https：//finance.yahoo.com/world-indices/）到一个数据帧使用下面的代码。但是，当我收到以下内容时：

ValueError：找不到表

import pandas as pd
major_indices = pd.read_html("https://finance.yahoo.com/world-indices/")
df = pd.read_html(driver.find_element_by_id("history_table").get_attribute('outerHTML'))[0]
df.head()

Output:
ValueError: No tables found

我试着检查页面，发现表格周围

有

<代码><；tbody data-reactid="；36"；>；..<；/t正文>；。

我试图搜索如何进行刮擦，但没有任何运气。

Pandas DataReader是未来的发展方向吗？有没有一个更强大的网络刮刀我应该使用，如硒或美丽的汤？

顺晟科技：

我建议使用Python研究BeautifulSoup的Web抓取功能。如果您使用像PyCharm这样的IDE，那么使用BeautifulSoup对象来查找网页的内容应该不会太困难。

这是你的例子的开始。


<tbody data-reactid="36"> ... </tbody>.

上一篇：JavaScript-有没有一种方法下一篇：HTML-打开带有Web链接的快速帮

网站建设

Html

Python-试图刮雅虎财经&quot；世界指数&quot；列表-堆栈溢出