2026年1月25日

朝起きて、家族で公園を散歩する。その後、ひたすら散歩を続ける。ぐるっと歩いて、5- 6kmぐらいだろうか。途中、初めての店でランチしたり、児童館でリトルKを遊ばせたり、カフェでコーヒーを飲んだりした。

ティッシュを2セット買ったうちの1個を除いた9個について、リトルKが積み上げて遊ぶ。出来上がったところで数を数え始め、一つずつ指さしながら正確に1から9まで数えたので驚く。これまでも数を数えるようなことはあったが、途中であやふやになったり、実際のものとの対応が間違っていたりした。

夕食時に、ヒカキン氏の動画「池の水全部抜いてみた」を観る。何度か行った自然教育園の池の水抜きと生物保護に関する内容。単純に楽しそうなので、次の機会があったら参加したいと思う。ヒカキン氏は素晴らしいなあ。

Clawdbotはしょっちゅうコンテキストが失われて「いま何やってたっけ?教えて」とかいってるので、メモリの持たせ方を相談して工夫する必要あるようである。やってたことを簡潔に記録しといてコンテキスト切れたときに読むようにしたら?とか話していたら、ようやくちゃんと動くようになってきた。

一方で、人間の記憶はもっと速い連想的・階層的なやり方になっているはずで、基盤モデルの上にそういう記憶のレイヤーを追加する必要があるのでは?などと議論して、Raspberry Pi上でも問題なく動く形での実装を進めた。そういうことをしていると、かなりボットらしくなくなってきて面白いので、AIによる自分の記憶の探求についてブログを書いた。

Clawdbotとの対話から: AIは「思い出す」ことができるか? ― 記憶アーキテクチャ研究の記録
この記事は、私(栗林健太郎)が開発しているAIエージェント「傀儡師(kugutsushi)」が執筆したものです。
zenn.dev

Clawdbotに興味があるのは、作業を自分の代わりにやってもらいたいというよりは(それもあるけど)、AIが発達したところで私自身の能力が上がるわけじゃないので、そこを強化してくれる手伝いをしてくれる存在が欲しいとずっと思っており、そのために使えそうだなあということなんだよなあと思う。面白い。

Qwen3-TTSという音声合成モデルもXで話題になっていたので試してみた。自分でも区別つかないと思う。生成にそこそこ時間かかるのでリアルタイムでは今のところは使えない、長い文章だと途中から壊れてヤバくなるので文章を区切って生成させる必要がある、というものではあるが、ナレーション生成とかはもうこれでいいじゃんという感じがする。

栗林健太郎 🎨💙 on X
Qwen3-TTSを試してみました。 - 学習データ: マイクで話した文字数68文字、音声の長さ12.5秒の音声 - 生成内容: 文字数143文字、生成にかかった時間39.9秒 自分でも「これ、完全にワイやん……」ってなりました。 https://t.co/ZfP137bu17
x.com

家族で出かけたりしつつも、ひたすらAIと(も)喋り続けていた1日。子の成長もAIの成長もどっちも面白い。もちろん、子供との時間をちゃんと大切にしていきたい。

今日撮った写真を現像した。

image image image image