空と山と暮らし

パラグライダーと山歩きの記録、ときどき家と暮らし。

ブログ振り返りにNotebookLMを使ってみた

今回の記事は空でも山でも暮らしでもなく、今話題のNotebookLMを過去のブログ記事の振り返りに使ってみた備忘録です。なお、NotebookLMは複数ページに分かれるブログの入力が手間でしたので、Power Automateを利用した入力自動化の方法もメモしておきます。

─ 目次 ─

はじめに

私はブログ記事の文章が無駄に長いことを自覚していまして、過去記事を見返す必要があった時、自分事ながら地味に長文で面倒と思うことがしばしばあるほどです。そんな困りごとを見かねた(?)のか、Googleがブログの要約に利用できる新サービスをリリースしてくれました。それがNotebookLM

これは利用者が提示したデータを基に大規模言語モデルがテキストを生成するAIでして、入力には各種ドキュメントの他、複数のWebページ(ブログ)を指定することもできます。これが使い物になるなら過去ブログを調べるのが簡単になります。(記事を簡潔に書く努力もした方がいいね…)

 

で、早速どの程度できるのか試してみたところ、いろいろ制約はあるものの、想像以上に便利でしたので記事にまとめてみました。このレベルで会話できるなら、他の長文ブログを短時間で把握することにも使えそうです。

NotebookLM

NotebookLMは2024年6月6日に日本語向けリリースされたGoogleの無償サービスです。

技術的な詳細やユーザ登録方法などは既に情報が溢れていますので、ここではブログページを複数指定するときの注意点のみ書いておきます。

 

まず気になったのが、どの程度のデータ量を読み込めるのか。NotebookLMではユーザが「ノートブック」を複数作成し、各ノートブックに複数の「ソース」(今回はブログページ)を入力できます。ここでNotebookLMの大規模言語モデルは、1つのプロンプト(問い合わせ)に対して全ノートブックを対象に走査することはできず、各ノートブック毎のスコープで動作します。つまり、1つのノートブックに入れられるソースの量で、一度に解釈できるデータ範囲が決まります。その仕様は「1つのノートブックに50ソース、1ソースに最大50万語まで(計2500万語)」でした。

ちなみに昨年12月時点の英語版は最大20 ソース× 20万語 = 400万語で、つまり半年で6倍に増えていますので、この制約は今後緩和するかもしれませんね。

 

さて、私のブログ記事は今現在100ページほどありますので、全ブログページを1つのノートブックに入れることはできません。ただし、長文ブログとはいえ最大50万語にはかなり余裕があります。(「語」は文字単位ではなくトークン単位と思われます)

この対処として、複数ページを50万語以下ずつに結合してソース数を50以下に削減することが考えられますが、これをやってしまうと、生成AIの回答時に付与される文献リンクとブログページの関連付けが分かりにくくなってしまうというデメリットがあります。

ここで実際にブログを振り返る時のことを考えると、運用としては話題ごとにノートブックを分割しても良いと考えました。例えば、今までで一番長いシリーズ物の注文住宅シリーズでも、全30話+おまけ2話 = 32ページで50ソース内に収まります。もし話題ごとに区切るのが面倒になったら、ざっくり時期(年)ごとに区切っても良いかもしれませんね。

 

そうと決まれば、早速注文住宅シリーズのブログページを全部指定して・・・みようと思ったのですが、現状のNotebookLMはURLを1件ずつGUIで入力する仕様になっていました。

うむ、これは面倒だ…。

 

まだ32ページだけならURLをチマチマと手動入力しても良いのですが、今後ほかWebの要約に使うことも考えたら一括入力できないと手間すぎます。ということで、自動化(RPA)ツールを利用することにしたのですが、ここでWindows11で標準搭載になったRAPツールのPower Automate for Desktopが自宅PCにプレインされていることを思い出し、初めて使ってみることにしました。

Power Automate for Desktop

自動化のためには、まず対象ソースのURLをリストアップする必要があります。これは注文住宅シリーズのリストページを開いてブラウザの「ページのソースを表示」で対象URLが入ったテキストが取得できます。これをテキストエディタgrepで必要なURL部だけ抽出するのは簡単ですね。

いちおう、ここも自動化できると思いますが、ブログによって広告リンク(ソースから除外)のフォーマットが違ったりしますので、それらを網羅して自動化スクリプトを書く方が手間になりそうです。

 

対象ソースをリストアップできれば、後は抽出したテキストエディタの各行を順にNotebookLMへコピペすれば良さそうです。これをPower Automateで作ってみました。

以下、作成例です。(テキストエディタにフォーカスしてカーソル移動&1行コピー、ブラウザのソース指定欄にペースト、を繰り返す)

Power Automateにはキー/マウス操作を記録する機能があり、それで基本動作をマクロ化させた後に、繰り返し処理を手動でフローに追加すれば完成。なんともお手軽ですね。

注意点としては、NotebookLMのソース追加ボタンはソース追加するごとにXPATHの要素位置が変わるため、ボタンを画像で指定すべきという位でしょうか。

 

フローを作成後に再生ボタンを押して放置すると、無事に対象ソース32個を全てNotebookLMに登録してくれました。

どのようなブログなのか指定していないのに、自動で家のアイコンが割り当てられたところが生成AIらしいですね。

 

自動化ツールを用意しておけば、例えば年ごとに分けた最大50個づつのブログページ10年分(最大500ページ)を、年別ノートブックに入力するカスタマイズも簡単ですね。

NotebookLMを試してみた

読み込んだブログの内容は、対象のノートブックを開いてChatで問い合わせることができます。

「このブログを400字程度で要約してください。」

 ↓

このブログは、「空と山と暮らし」と題し、筆者がローコストハウスメーカーで高気密高断熱住宅を建てる過程を記録したものである。[参照]
ブログは、土地探しから始まり、建築条件付き土地の選択と解除、ハウスメーカー選び、詳細な設計打ち合わせ、地鎮祭、上棟、そして最終的な引き渡しに至るまで、家づくりの各段階を網羅している。[参照]
筆者は、高気密高断熱住宅の性能を最大限に引き出すため、東京ゼロエミ住宅の基準を満たすための工夫や、太陽光発電システムの導入、省エネな設備選びなどを詳細に記録している。[参照] また、間取りやインテリア、外構についてもこだわり、快適で機能的な住まいを実現するための試行錯誤が詳細に綴られている。[参照]
さらに、ブログでは、建築過程における費用についても言及しており、ローコスト住宅メーカーを選択しながらも、オプション費用や施主支給のコストなどを分析し、予算内で理想の住宅を建てるためのノウハウも提供している。[参照]

うん、32ページのブログ全体を要約できていますね。

 

ページ下に質問例が3つ出てきまして、それをクリックして質問することもできます。

 

「家づくりの過程で、筆者が戸惑った選択は何か?」

 ↓

家づくりの過程で、筆者が戸惑った選択は複数挙げられます。

●建築条件付き土地の選択: 筆者は、駅からの距離、日当たり、静かさなど好条件が揃っていたことから、建築条件付き土地を先に契約しました。しかし、後から調べると、この買い方は建物側に制約が出てしまうため、失敗しやすいことを知りました。 その後、建築条件付きの施工会社では気密性能の保証が難しいことが分かり、思い切って建築条件を外すことを決断しました。

●玄関の位置: 筆者は、LDKからの景観、日当たり、斜線規制などを考慮し、玄関を西側にするか東側にするか悩みました。最終的には、LDKに長く光が入るよう、東側玄関を選択しました。

●照明の選択: コスト削減のため、照明は引き渡し後にDIYで設置することを考えていましたが、東京ゼロエミ住宅の補助金を受けるには、引き渡し前にLED照明を設置する必要があることが分かりました。そのため、ハウスメーカー経由で照明を選ばざるを得ず、コスト高になってしまいました。

●エアコンの選択: 東京ゼロエミ住宅の規定により、1階の暖房用エアコンは省エネ基準トップランナー制度の上位機種をハウスメーカーで設置する必要がありました。そのため、量販店のセール時などに安価に購入するよりも高くなってしまいました。2階の冷房用エアコンは自由設置可能でしたが、F式全館冷房に適した機種選びに悩んでいました。

●外構業者の選択: ハウスメーカーが紹介する業者と、自分で選んだ業者との間で、価格、提案内容、工事開始時期などを比較検討し、悩んでいました。
これらの選択以外にも、筆者は家づくりの過程で様々な選択を迫られ、その度に戸惑いながらも、自分たちの暮らしに最適な選択をしようと努力していました。

悩みも、初期の土地選びから終盤の外構まで幅広く抽出できています。1番目の質問には「である調」で答え始め、2番目の質問は「ですます調」になっている理由は良く分からないですが、内容には間違いがありません。いやはや、お手軽すぎて凄いな。

 

では、複数ページに渡る細かい内容の質問に答えられるでしょうか?

「1Fと2Fで採用したエアコンをそれぞれ教えて。」

 ↓

1Fと2Fのエアコンについてご説明します。

●1Fのエアコン: 富士通ノクリアのAS-Z282Mが設置されています。東京ゼロエミ住宅の補助金を受けるため、ハウスメーカー経由で設置されました。[参照] 当初はダイキン、日立、三菱電機も検討しましたが、最も安価だったため富士通ノクリアが採用されました。[参照]

●2Fのエアコン: 三菱電機霧ヶ峰のMSZ-JXV2223が設置されています。[参照] 当初は2022年モデルのMSZ-X2222Dを検討していましたが、納期の都合で2023年モデルのMSZ-JXV2223に変更になりました。[参照] 2Fエアコンは東京ゼロエミ住宅の補助金の対象外のため、施主支給で設置されました。[参照]

合ってますね。参考にしたブログのリンクも表示されるので、回答が正しいかチェックもできます。

NotebookLMがあれば長文の元ブログを読む必要は無いという気がしてきたぜ…。

まとめ

このNotebookLM、例えば私のヤマレコ記録をインプットしたら、これまでの登山記録を参考に、今の季節におススメの山とか提案してくれそうです。これが無料とか、AI関連のビジネスモデルは相変わらず意味不明ですね。

他の方のブログや長い論文も短時間でサマライズできますので、色々試してみたくなりました。ということで今日のブログはここまで。