18910140161

html-r:如何对{{variable}}容器堆栈溢出进行webscape

顺晟科技

2022-10-19 11:56:56

52

webscring时,我得到:。webbrowser显示价格为S/1800.00(某个数字),查看源代码可以看到。

发生这种情况的原因是,我正确地获得了所有其他变量。

代码:

{{price}}

更新1:

我注意到产品会重复,即存在产品的重复,即使它们在浏览器中的第1页和第2页中有不同的产品。

为什么?


顺晟科技:

如何webscrape{{variable}}容器

这里的答案是花一些时间通过研究页面源、调用的各种JS脚本和network选项卡来确定页面如何动态更新自己。我想你可以跳过搜索网络选项卡,希望在那里找到你想要的东西。但是,在学习一些关于模板、内容提供程序、动态页面如何更新等方面的知识时,您会失败....

您看到的是JavaScript模板。内容提供程序VTEX提供了模板和各种脚本,这些脚本驱动使用实际值(例如{{price}}和{{percent}})更新这些“占位符”。

为了获得您想要的值,这里需要注意的是,这里有一个API端点,它具有来自页面的产品ID,并且返回的JSON包含您要查找的内容。您可以通过动态提取ids并向API发送相同的GET请求来复制此请求。

借助辅助函数,您可以提取折扣,然后从互联网价格中减去折扣。虽然API调用返回了各种其他价格(以及更多信息),但我决定从初始GET请求中提取其他价格。


以下是一个URL示例:

{{price}}
  • TAG:
相关文章
我们已经准备好了,你呢?
2024我们与您携手共赢,为您的企业形象保驾护航