Griverさんへの返信 その2

抽象的なことばかり話してもどうかなと思ったのでコードを弄りました。見落としていたURLの分を考え直しています。

walkerplus

//main//ul[.//img]|descendant::*[./figure/a][1]

アイテム: walkerplus - データベース: AutoPagerize - wedata

article_listへの拡張を踏まえulの取得範囲をmain内に限定しました。

あと現状の walkerplus では 2ページ目に画像がないと継ぎ足せないようです。
https://www.walkerplus.com/article/1061211/

こちらはあまり機能の必要性を感じません。保留とさせてください。他に機能しない例があればまた考えます。

pixiv

//div[@class="event-information"]|(//nav|//div[@class="_pager-complex"])/following-sibling::*[./following-sibling::nav or ./following-sibling::div[@class="_pager-complex"]]|//*[./div[@class="_pager-complex"]]/descendant::ul[last()][count(//div[@class="_pager-complex"])=1]

アイテム: [pixiv] - データベース: AutoPagerize - wedata

ページャーの間を取得しています。//div[@class="_pager-complex"]をカウントすると1、つまりページャーが1つしかなければ親ノードから見て最後のulを取得しています。

残りは感想を書きます。

pixiv も walkerplus サイトが大きく複雑で要素名だけで解決しようとするのは難しいのではないか?

確かにそうかもしれません。いただいたアドバイスを生かしたつもりですが、現状はどうでしょうか。

exampleUrl が増えて動作確認が大変なのではないか?

exampleUrlが増えるのはwedataにはよくあることです。

動作確認がしやすい、あるいは難しいのは何をもって決まるのかよくわかりません。多分主観の問題な気がするので、もしそうだとすれば好きにさせてもらえないでしょうか。

今後も同じような誤作動が起こるのでは?

一応注意するつもりではいますが、これまで通り気づいたら修正するだけです。