2023年5月17日
昨晩は、寝床で吉田健一『わが人生処方』を読み始める。彼がこの辺に収められているエッセイを書いていた年齢と、自分の今の年齢とは、そんなに変わらないんだよなあ。この彼我の差よ。まあ、そういうことをいいだしたらキリがないのであるが。
画像生成AIに関して、近頃また様々な切り口から話題になっている。昨年、Stable DiffusionがOSS化されたあたりに触って以降あまり触れてきてなかったので、エコシステム込みでキャッチアップしなければなあと思う。それで、NeosVRをやらなくなってからほぼ放置していたPCを立ち上げ(WIndows11にアップデートするとかはしていた)、Stable Diffusion Web UIを入れてあれこれ触ってみたりした。
また、LLMの方でも「サイバーエージェント、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開 ―オープンなデータで学習した商用利用可能なモデルを提供―」というリリースが出ていたので、ついでにPCでJupyter Labを起動して動かしてみた。3Bモデルはけっこうサクサク動く感じ。7Bモデルは、RTX3080 Tiだとメモリが12GBしかなくて足りないようで、かなり時間かかる感じ。
あれこれやってみたくなることはあっても、自分の知識が足りなくてよくイメージできないということも多い。もうちょっと腰を据えて取り組んでいく必要がありそうだ。
今日のブックマーク
- サイバーエージェント、最大68億パラメータの日本語LLM(大規模言語モデル)を一般公開 ―オープンなデータで学習した商用利用可能なモデルを提供― | 株式会社サイバーエージェント
- NVIDIA Container Toolkit (NVIDIA Docker) は何をしてくれるか - Qiita
- Google Colab で OpenCALM-7B を試す|npaka
- [hiromichi kamataさんはTwitterを使っています: 「GPT-4のブラウジング機能が開放されたので、会社の先輩が最近CVPRに通した論文をGPT-4に査読させ直してみました この論文には私も軽く目を通しているのですが、部分的に誤解している箇所があるとはいえ、かなり的を射たreviewを返してくれています 論文投稿の際の壁打ちとしてかなり有用そう](https://t.co/krGrcFZPaH」 / Twitter https://twitter.com/chagallblau/status/1658501564674486272?s=12&t=oh3PTeK1YGO3XG0c-mdpyQ)
- rinna、日本語に特化した36億パラメータのGPT言語モデルを公開|rinna株式会社のプレスリリース
- 「Web会議室の機器こそ “オーバースペック”を」 情シスコンサルのプロがおススメする製品の実力とは - ITmedia ビジネスオンライン
- CyberAgentの日本語言語モデルを試してみる - きしだのHatena
#日記 #5月17日