「一茶俳句上中下抜粋 縦書き」のデータ収集について
ウェブサイト「
一茶句集(http://yoshiok26.p1.bindsite.jp/bunken/cn14/pg590.html)」からデータを拝借しました。
-- 一茶句集 からHTMLデータを受ける
get url "http://yoshiok26.p1.bindsite.jp/bunken/cn14/pg590.html"
-- HTMlの設定から俳句だけを残して バリアブル「tKu」に収納
repeat for each line tLine in it
if tLine contains "fsize_ll" then
replace "<span class=" & quote& "fsize_ll" & quote &">" with empty in tLine
replace "<p>" with empty in tLine
delete char offset("<", tLine) to -1 of tLine
replace " " with comma in tLine
if tLine is not empty then put tLine &cr after tKu
end if
end repeat
put tKu