2015年12月1日 星期二

DVD字幕轉SRT

最近幾天都在搞這個www
基本上DVD的字幕都是圖形,
所以必須做OCR(光學辨識),
網路上有許多教學,
↓(這2個都寫得很清楚)
[字幕教學] DVD或.sub轉.srt字幕 (SubRip + SubToSrt)
Barry's 影片字幕教學網
拜前輩所賜,成功搞好了一片DVD。(呼~


不過用SubRip將字幕檔轉成BMP再用SubToSrt OCR,
得要龐大的字庫,沒有字庫SubToSrt碰到認不得的字會問你,
這時就得一個個字KEY,
第一片有前人分享的字庫,KEY個幾下就完成了,
第二片大概是年代有點久遠,把BMP丟進SubToSrt
它竟然一個字都認不得T_T!!!

這時候就要用其他的OCR方法了OTL,
我找了老半天,用idxsubocr辨識繁中是比較靠譜的方法。
↓(這有繁中版)
[更新:2013-06-01]繁體中文版 IdxSubOcr(圖片式字幕轉文字式字幕)
idxsubocr只能吃 .idx,所以得先用Vobsub轉出 .idx
在讓idxsuboc辨識前得先確定Microsoft Office版本,
idxsubocr是用Office內建的MODI辨識的,
但是只有2007之前有內建,2010之後得另外裝
↓(免費)
https://support.microsoft.com/zh-tw/kb/982760

都搞好了之後就來OCR吧!
結果有8-9成辨識得出來,
真令人感動!(嗚嗚嗚~

喔,在出現令人感動的結果之前,
還有一個問題,
我把 .idx丟進idxsubocr時竟然一片空白!
應該要有白底黑字的圖片啊,
竟然一片空白T皿T
折騰了好一陣子之後才發現要改 .idx

首先custom colors要ON
然後再照著參數去改就可以了
tridx 1=OFF 0=ON
第1個是背景顏色
第2個是字幕顏色
第3個是陰影或外框顏色
第4個是第二層陰影或外框顏色
000000是黑色
ffffff是白色
aaaaaa是灰色..等等


以上。

沒有留言:

張貼留言