最終更新: 2026-04-22 / アクティベーション認証は不要になりました
原稿やYouTube URLを渡すだけで、台本作成・音声合成・サムネイル生成・説明文作成まで
Claude Code が全自動で完結し、Stand.fm に下書き保存するパイプラインツールです。
ダウンロード
my-voice-to-standfm フォルダを任意の場所(例: デスクトップ)に置いてください。
pip install requests python-dotenv playwright openai-whisper google-generativeai google-genai Pillow playwright install chromium
.env.example を .env にリネームし、下記5項目を入力してください。
my-voice-to-standfm フォルダをプロジェクトとして開いてください。
/my-voice-to-standfm音声合成エンジンの MiniMax Audio を使用します。
https://platform.minimax.io/user-center/basic-informationこのページがプロフィール・APIキー・Group ID 全ての入口になります。
eyJhbGc...で始まる長い文字列)をコピーし、.env の MINIMAX_API_KEY= に貼り付け。.env の MINIMAX_GROUP_ID= に貼り付けてください。
こんにちは。今日はとても良い天気ですね。 私はAI音声の実験をしています。 ゆっくり、はっきりとした発音で、自然に話しています。 この声がクローン音声として再現されるのが楽しみです。 それでは、よろしくお願いいたします。② Voice Clone 画面を直接開く(これ重要)
myvoice_01)moss_audio_XXXXXXXX-XXXX-... 形式。これをCSVの voice_id 列にそのまま貼り付ければ自分の声で生成されます。
speech-2.6-hd に固定しています。speech-2.8 は関西弁風イントネーションになるため使用しません。MiniMax_Audio_初心者マニュアル.md(料金プラン・エラー対処・クローン品質向上のコツ)も参照してください。
サムネイル画像生成・放送説明文生成に使用します。
AIza... で始まるキーが発行されるのでコピーし、.env の GEMINI_API_KEY= に貼り付け。
gemini-3.1-flash-image-preview を使用。無料枠でも利用可能ですが、生成枚数に制限があります。
サムネイル・音声・説明文を自動で下書き保存するため、Stand.fmのログイン情報を使用します。
取得したキーを .env ファイルに記入します(.env.example をコピーして .env にリネーム)。
MINIMAX_API_KEY=eyJhbGciOiJSUzI1NiIsInR5cCI6IkpXVCJ9.xxxxxxxxxxxxx MINIMAX_GROUP_ID=(ここにMiniMaxのGroup IDを貼り付け) GEMINI_API_KEY=AIzaSyXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX GEMINI_IMAGE_MODEL=gemini-3.1-flash-image-preview STANDFM_EMAIL=your-email@example.com STANDFM_PASSWORD=your-password-here
= の前後にスペースを入れない以下のコマンドでMiniMax音声生成がエラーなく動けばキー設定はOKです。
py scripts/generate_audio.py out/scripts/台本.csv
401 Unauthorized や API key invalid が出た場合はキーの貼り間違い・空白混入がないか再確認してください。