如何解决从无序列表中选择时如何最好地处理可变项目数和订单
我从ul元素内的列表项获得innerText-Properties,该元素可以具有4到10个li-items。 有些项目(例如个人档案名称,年龄和位置)将始终存在,而其他项目(例如当前学期,学历和其他有关学生资料的信息)可以填写,但不必填写。 因此,几乎每个配置文件和:nth-child(x)-元素的列表长度都不同 会一直包含不同的信息。 我想用该数据作为对象构造函数的输入,期望将度数作为第5个参数。
您将如何检查列表中存在哪些信息,并设置一个占位符,例如“ n.a.”。缺少价值?那是我什至应该在节点脚本中尝试做的事情吗?还是这是以后在数据库中的工作?
我的puppeteer函数通过其querySelectors来获取元素,直到出现该问题为止。
var ratingDetails = await page.evaluate(() => {
//get each element (that could be available) from a div
let text = document.querySelector("div.report-text").innerText
let age = document.querySelector
("div.card-block > ul.list-unstyled > li:nth-child(1) > span").innerText
let sex = document.querySelector
("div.card-block > ul.list-unstyled > li:nth-child(2) > span").innerText
let startYear = document.querySelector
("div.card-block > ul.list-unstyled > li:nth-child(3) > span").innerText
let studyForm = document.querySelector
("div.card-block > ul.list-unstyled > li:nth-child(4) > span").innerText
let location = document.querySelector
("div.card-block > ul.list-unstyled > li:nth-child(5) > span").innerText
[...and some more...]
})
//and then use the spread syntax to fill my constructor
await ratingDetails.map(facts => new ReportObject(...facts)));
非常感谢您提供有关如何解决该问题的建议!
解决方法
经过多次尝试和错误后,我提出了以下解决方案:
- 循环遍历无序列表中的每个li元素,然后获取innerText-Properties
let text = [];
for (let counter = 1; counter <= metaListe; counter++) {
text = await page.evaluate((counter) => {
let liElements = document.querySelector(`div.card-block > ul.list-unstyled > li:nth-child(${counter})`).innerText.trim();
return liElements;
},counter);
- 为所有可能的项目定义一些regEx模式
const patt_jahrStudBeginn = /^Studienbeginn/;
const patt_abschluss = /^Abschluss/i;
const patt_aktFS = /^Aktuelles/;
const patt_studienForm = /^Studienform/;
[and some more...]
- 将第1步中的innerText-Properties与模式进行比较,如果匹配则返回一个变量(并继续下一个字符串/ innerText
if(!document.querySelector(`div.card-block > ul.list-unstyled > li:nth-child(${counter})`))
{return;}
else{
if(patt_studienForm.test(text)) {
let studForm = document.querySelector(`div.card-block > ul.list-unstyled > li:nth-child(${counter}) > span`).innerText;
}else{
if(patt_studienDauer.test(text)) {
let studDauer = document.querySelector(`div.card-block > ul.list-unstyled > li:nth-child(${counter}) > span`).innerText;
}else{
if(patt_jahrStudBeginn.test(text)) {
let jahrBeginn = document.querySelector(`div.card-block > ul.list-unstyled > li:nth-child(${counter}) > span`).innerText;
}else{
if(patt_aktFS.test(text)) {
let aktFS = document.querySelector(`div.card-block > ul.list-unstyled > li:nth-child(${counter}) > span`).innerText;
[...and more...]
并返回所有包含与page.evaluate()函数不同信息的变量。 我花了相当多的时间来理解,我必须将任何计数变量传递给.evaluate()方法,以便能够使用其中的当前循环索引来引用第n个列表元素。
那个超深的if条件不能是好的代码。我可能会问一个问题,如何用数组增强这种比较类型。但是它照原样工作。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。