SHIMIZU_NORIAKI

基本的にメモ代わり

youtube のURLから音声を書き起こす方法

Google Cloud Speech-to-Text APIを使用するために、google-cloud-speechパッケージをインポートし、サービスアカウントのJSONキーファイルを使用してSpeech-to-Textクライアントを初期化します。スクリプト内の以下の行を確認してください。

python
Copy code
client = speech.SpeechClient.from_service_account_json("credentials.json")
credentials.jsonの部分を、作成したサービスアカウントキーファイルの実際のファイル名に置き換えてください。

音声認識の設定を行います。以下の行では、音声のエンコーディング、サンプルレート、言語コードなどを指定しています。
python
Copy code
config = speech.RecognitionConfig(
encoding=speech.RecognitionConfig.AudioEncoding.LINEAR16,
sample_rate_hertz=16000,
language_code="ja-JP",
)
必要に応じて、これらの設定を変更してください。例えば、言語コードを"ja-JP"以外のコードに変更することもできます。

音声ファイルを読み込み、音声認識を実行します。
python
Copy code
with open(audio_file, "rb") as audio:
audio_content = audio.read()

audio = speech.RecognitionAudio(content=audio_content)

response = client.recognize(config=config, audio=audio)
認識結果を表示します。以下の行は、認識結果をコンソールに表示するためのループです。
python
Copy code
for result in response.results:
print("Transcript: {}".format(result.alternatives[0].transcript))
認識結果は、Transcriptのプレフィックスを付けて表示されます。必要に応じて、結果をファイルに保存するなど、さまざまな処理を追加できます。

以上が、Pythonを使用してYouTubeのURLから音声を書き起こすための手順です。このスクリプトを使用すると、YouTubeの動画から音声を抽出し、Google Cloud Speech-to-Text APIを使用して音声認識を行うことができます。