AIによる記事自動生成ブログ四三式

このブログは天才チンパンジー「アイ(AI)ちゃん」が、言語訓練のために作成しているものです。

tsファイルの字幕を抽出してみる

字幕表示編第2章

第1章はこちら↓

http://type43.hatenablog.jp/entry/2014/06/10/152838

うっかり字幕表示なしでキャプチャしちゃった画像だとか、あとからあの時なんて言ってたっけな?って時にいちいちtsファイルを開いてシークバーをちょこちょこサーチするのは億劫、というかめんどくさすぎる。

という訳で、tsファイルから字幕データの抽出をやってみる。

字幕編集ツールシ リーズ for cuttermaran(with Caption2Ass字幕位置・色情報対応版)

http://www2.wazoku.net/2sen/friioup/source/up1052.lzh

から

Caption.dll

Caption2Ass.exe

Caption2Ass.ini

Caption2Ass改.txt

だけを残して後は削除。(別に削除しなくてもいいけど)

その後、同一ディレクトリにGaijiフォルダを作成しておく。ここに外字イメージが画像として登録されていく。作成しておかないと毎度エラーが発生して面倒。

で、ここのCaption2Ass.exeにtsファイルをドラッグ・アンド・ドロップ。

 

【2018/10/31追記】

画像1

・・・とのこと。

するとtsファイルのある場所に同名のassファイルが出来る。

テキストエディタで開けばご覧の通り。

Dialogue: 0,0:19:27.31,0:19:29.44,Default,,0000,0000,0000,,{\pos(799,520)}(ミケランジェロ)これ イケてる!\N
Dialogue: 0,0:19:29.44,0:19:33.13,Default,,0000,0000,0000,,{\pos(709,340)}(ドナテロ)まだ 試作品だよ。\N
Dialogue: 0,0:19:29.44,0:19:33.13,Default,,0000,0000,0000,,{\pos(799,540)}(ミケランジェロ)フ~フ~ ハ~!\N
Dialogue: 0,0:19:33.13,0:19:37.00,Default,,0000,0000,0000,,{\pos(739,340)}僕 これ超好き!\N
Dialogue: 0,0:19:33.13,0:19:37.00,Default,,0000,0000,0000,,{\pos(799,400)}ラジオついてないの?\N
Dialogue: 0,0:19:37.00,0:19:39.07,Default,,0000,0000,0000,,{\pos(799,340)}あぁ ラジオはついてないよ!\N
Dialogue: 0,0:19:39.07,0:19:41.67,Default,,0000,0000,0000,,{\pos(799,340)}聞いてるか? レオ 試作品だ。\N
Dialogue: 0,0:19:44.44,0:19:46.48,Default,,0000,0000,0000,,{\pos(799,460)\c&H00ffff&}問題ないぞ。\N

copy
時間と字幕位置etc、結構複雑な情報が定義されているようで、Aegisubなるオープンソースな字幕編集ソフトのフォーマットに従ってる、らしい。ts内部の字幕情報というよりは Caption2Assの設計思想っぽい感じだけど。

とりあえずこれで何を言っていたかの確認(しかも正確なセリフ)としては目的達成。

てか、テキスト加工前提(かつ動画自体が字幕対応のもの限定)だけど、やろうと思えば簡単にセリフ全文のテキスト起こしができる。これって結構凄いかも。

昔やってた練馬大根ブラザーズの登場曲歌詞起こし、今は当時のブログが消滅してしまって何も残ってないんだけど、持ってるDVDに日本語字幕あれば再構築できるんじゃないか。アニメDVDに日本語字幕なんてほとんど無さそうだけどね。