[Google Apps Script] Google Apps Script で sitemap.xml から URL とタイトルのリストを生成する
Google Spreadsheet で使う関数を作成します。
sitemap.xml から URL リストを取得する
UrlFetchApp.fetch()
でファイルを取得。
XmlService
を利用してパースします。
とても分かりやすいコードが公開されていましたので利用させて頂きましょう。
コード.js
にコードをコピーすれば sitemap()
関数が利用できるようになります。
URL リストから対応する title を取得する
UrlFetchApp.fetch()
で HTML を取得。
.match
を利用してマッチした文字列を抜き出します。
/**
* Return <title> content
*
* @param {"https://www.example.com/foo.html"} url REQUIRED The url of the page
* @return Return string from a page title
* @customfunction
*/
function getTitle(url) {
var _options = {
method: "GET"
};
try {
var _response = UrlFetchApp.fetch(url, _options);
var _regexp = /<title>(.*?)<\/title>/;
var _title = _response.getContentText().match(_regexp);
return _title[1];
} catch (e) {
return e;
}
}
コメントを書いておくと関数利用時にヘルプが表示されます。