18910140161

JavaScript-用Puppeteer-Stack溢出获取嵌套HTML元素的类名

顺晟科技

2022-10-19 11:47:16

160

我正在尝试获取所有具有类名的元素,我已经尝试了多次尝试,以及许多其他的尝试,但似乎无法获得正确的元素。我在点上得到了对象,但无法解析它。我知道有一种方法可以做到这一点,但老实说,我对puppeteer和Javascript是新手,无法理解。

这是一个日程安排工作日的日历,我正试图进一步了解并获取日期和时间。不过,我想把它放在for循环中,这样我就可以获取所有的工作时间。

我不需要修复我的代码,因为我知道它很乱,但我只需要知道如何获取这些元素


这里是我到目前为止的一些代码,尽管我尝试了许多东西,但它很混乱

td

td


顺晟科技:

首先,我建议使用http客户端和cheerio.js进行刮擦,因为它更快、更轻量级。但是我可以理解为什么您会因为身份验证而使用puppeteer。

您可以使用puppeteer获取页面的html,然后将其传递到Cheerio中。但是如果您希望使用http客户机来完成此操作,则如下所示:

首先,这里是HTML的模型:

最后,我们需要一个包含如下所示对象的数组:

为此,我们首先需要选择保存所需所有项的父项。在本例中,它是$$(“.etmcursor tbody tr”)。这将为use提供一个表中所有TR的列表。etmCursor.

现在我们必须遍历表行(tr)并获取对象属性。

.map()方法的工作方式与法线映射相反,在法线映射中,在索引之前获取元素。由于它使用集合,我们必须使用toArray()将其转换为数组。

我们使用。find()对选定的对象进行搜索。

.text()获取使用该元素的文本。

现在我们应该有您需要的数据了。

  • TAG:
相关文章
我们已经准备好了,你呢?
2024我们与您携手共赢,为您的企业形象保驾护航