18910140161

HTML-如何从Chrome Web scraper插件的可视化弹出窗口中提取数据?-堆栈溢出

顺晟科技

2022-10-18 13:48:07

197

我正在尝试从这个网站提取数据(徽标图像,名称,位置等):https://websummit.com/startups/featured-startups?q=eyjwywdlijoxlcjjb25mawd1cmuionsiagl0c1blclbhz2uiojq4lcj0ywdgawx0zxjzijpbindzmjeixx19

问题是,当点击图片时,会出现一个可视的弹出窗口(URL不会改变),所以我尝试了各种选择器(我使用的站点地图示例:Home>;>;弹出式选择器(带有多个选项)>;>;文本选择器的名称,位置等),但它们都不工作(我可以看到数据,但在抓取后没有可用的数据)

有没有人能告诉我站点地图出了什么问题,或者使用什么选择器来访问可视化弹出窗口中的数据?


顺晟科技:

没有使用选择器按钮,而是使用了弹出链接选择器和我从页面中提取的CSS,然后选择了多个复选框。

<代码>ID选择器类型多个父选择器操作Startup-logoμiPaper-rootμicard-root.jss51.muipaper-elevation1.muipaper-rounded selectorPopUplink Yes_root

enter image description here

我还创建了下面的子选择器

<代码>ID选择器类型多个父选择器操作启动名称span.jss53选择器文本无启动徽标

enter image description here

enter image description here

这种方法适用于所有其他选择器,但不适用于PopUplink.这让我相信弹出链接选择器坏了。

多个页面

都说插件没有返回数据,这证实了这一点。

所以基本上,停止使用这个插件,而是使用其他替代方案。以下是我所知道的几个例子:

或者,如果您愿意进行一些编程,可以看看Selenium,因为它是收集数据的终极工具。

  • TAG:
相关文章
我们已经准备好了,你呢?
2024我们与您携手共赢,为您的企业形象保驾护航