18910140161

html-web刮削表R-堆栈溢出

顺晟科技

2022-10-19 13:12:16

96

我正试图从此网站上的分级列获取数据https://www.ratingraph.com/tv-shows/one-piece-ratings-17673/,但“{xml_nodeset(0)}”出现问题。

我的尝试:

library("rvest")
`%>%` <- magrittr::`%>%`

page <- read_html("https://www.ratingraph.com/tv-shows/one-piece-ratings-17673/")
table <- page %>% 
  html_nodes("table") 
df <- table[2] %>% 
  html_table()

这些是我需要的数据:


顺晟科技:

通过检查页面并查看“Network”选项卡,您可以看到它为创建表而进行的调用。 响应在JSON中,很容易解析为R列表。 对于您的目的来说,这其中的大部分可能是不必要的,所以您可以缩短它。 如果要超过25行,请增加长度=25,或将其删除。

library("rvest")
`%>%` <- magrittr::`%>%`

page <- read_html("https://www.ratingraph.com/tv-shows/one-piece-ratings-17673/")
table <- page %>% 
  html_nodes("table") 
df <- table[2] %>% 
  html_table()
  • TAG:
相关文章
我们已经准备好了,你呢?
2024我们与您携手共赢,为您的企业形象保驾护航