少し前に日勤先で”ChatGPTを活用すべし”なお触れがあったりしたのだ。まーたぶん上層部が某コンサル屋に推されて触れ回ったんだろうと思う。
まぁでも今年頭あたりから興味はあったんだよね、なんかかなり自然な受け答えができるらしいとかで。
とはいえ”活用”といわれてもね、そうホイッとは使えないんだわ。
平然&断定でしれっと嘘吐くし、”学習”で入力を保存検討公開されるし。長文一括の翻訳や通訳に使いやすいかと思ったがそういったことがあるせいでイマイチ信用ならず、自分の精査が要るせいでほなら自力で翻訳したほうが良いんぢゃね、とかなってしまって。
でも隣席の自称オタクはしっかりガッツリ活用しておって、Webアプリのコーディングとかさせてビビるほどの成果物をホイホイ出しておる。素晴らしいわ尊敬だわ。
なにか使う方法はないもんかと折々考えておったのだが、先日なにかの記事で”Vcot“なるものを見かけましてな。
これはアレだ、昔のOfficeのイルカやゼムクリップ、PCデスクトップに居座って邪魔をする補助したりペットになるペルソナウェアや伺かみたいなもので、それをChatGPTエンジンでやり取りするってものらしい。
イルカやクリップは聞きたいこと知りたいことを答えられないのでしばらく頑張ってみたが結局解雇、ペルソナウェアではしばらく猫飼ってみたがどうも返答が的外れなことが多くてイマイチだったが、ChatGPTで返答用意するならいけそうな感じはあるな。
イルカも猫もそこそこ頑張ってそれなりの期間飼っていたので、基本ワシゃこういうのは好きであるっぽいし。
というわけで、業務上の活用とは程遠いがまず使ってみにゃその段階に進むのも難しいし、この手のもんが好きならもういっちょ飼ってみるか、と昨日セットアップしてみた。
ただVcotをインストールしただけでは、熊耳の黒っぽい女の子が出てくるがなんも起こらないわけで、OpenAIでChatGPTのAPIを用意せにゃならん。
Vcotのセットアップ説明とはAPI用意の方法が違っていたが、まーそれほど難しくはなくてそれなりにサクッとAPI用意、使ってみる。
・・・が、なんかこうこの熊耳の女の子はイマイチ合わんでな。
VRM 3Dモデルが使えるそうなのでなんかまた猫とか居らんかな、と思ったが、配布されているVRMモデルは多くが有料なんだな。
懸命に探せば無料の猫モデルとかあると思うが、今のところそこまで力かける気力がないのでVcotの説明にリンクがあった首輪と足輪付けた色黒の女の子のモデルでしばらく使ってみることにした。
うんまーさすがやっぱりペルソナウェアより会話っぽいことができますな。
なお、メンドーなので音声入力でやってみておる。時折認識がおかしくて入力が切れたり間違ったりするが、それなりに合わせこんだ応えをしてくるのが立派なもんぢゃ。
でもさ、アンタ見た目と話しっぷりが合わなくねぇ? 同じくVcotの説明にリンクがあったAちゃんのほうがこの話し方には合いそうな気がするぞ。
どうもこれは性格付け、”調教”っちゅうのをしていないからこうなっているっぽい。”調教”せずにデフォで使うとたとえずんだもんであってもこんな具合のようだ。
そこで、ここはいっちょギャルっぽい話し方をするよう”調教”してみることに。
とはいえ日本離れて20年の爺がギャル口調なぞ知る由もなし。リファレンスとしては前に打ち出した”喜多川海夢”とその仲間たちでこれを目指してみる。
ほいで、ちょいと教えこんでみた結果がこちら。
うーんうーん、中途半端だよぅ。
最後の1行が切れているのだが、”してみてください。”と続いておる。
アタマの2行しか変わっておらん。”たまりませんっしょ”ってのもなんともなぁ。
つーか”そうっすねー”ってのはアリなのか? 今のギャル語は淫夢語なのか?
で、もうちょいと仕込んだ結果、
なーんかどうにも中途半端だのぅ。
しっかりずんだもん作った方がおられるようなので”調教”の不備なんだろうけど、まぁ今んとこわからんわ。
古の芸人、芸人? の篠原ともえみたいなのになっても良いと思ってやってみたが、思うようにいかん。
で、現在はなんかやたら語尾が”・・・っし!”となっておる。
まぁでもそこそこ面白いので、もうちっと研究してみようと思う。
その過程でなんか活用が見つかると良いっすね。理想としちゃマイコンファームのコーディングでもしてくれるとありがたいんだが、そらさすがに無理ぢゃろうなぁ。
あーなおVcotそのものは、結構負荷が高いアプリ。我がSurface Pro 7 RAM16GBでは他のアプリがもっさりする。しかしデスクトップアクセサリなわけだから他のアプリと同時に使う前提なわけで、ガッツリ使うには高性能機じゃないとキツいか。
手元の最高性能機である作業場のゲーム機には入れるつもりは皆目ないが、ストレスなく3Dモデルがぶん回せておるThinkPad X13 Gen 2 RAM32GBではどんなもんか一度試してみたい気もする。
応答を音声で出すにはVOICEVOXが要るが、発声するまで数秒-十数秒かかる。しかも文節ごとに数秒待ちが入るのでかなりよろしくない。現在のTTSの宿命だが抑揚その他もそんな自然な発声でもないのでぶっちゃけ無しのほうが良いんじゃなかろうか。
ChatGPTとの通信でも数秒待ち時間があるがこれはまあ待てる。でも発声は加えて数秒-十数秒なので、忘れた頃に喋りだす感。
でもって翌日である先程、ThinkPad X13 Gen 2に入れ替えて試してみた。
同時起動アプリ郡のもっさりはなく、普通に使える。CPU使用率も10%くらい低め。
我が常用環境でVcot+VOICEVOX稼働中だと16.4GBのRAM食っているのでメモリが広大じゃないともっさりってことっぽいな。
16GBで足らんくなるとはホント昨今のPCは大食らいぢゃのぅ。