ลงชื่อเข้าใช้ ลงทะเบียน: New Member

วิธีการแปลงซับไทย IDX SUP เป็น SRT หรือ text (DVD Sub Extractor OCR subtitle IDX SUP to text)

 
Vista2k7 โพสต์ 21-8-2012 10:50:30
DVDSubExtractor
วิธีแปลงไฟล์ .idx, .sup เป็น .srt หรือ .ass ได้ง่ายๆ และรวดเร็ว (อีกทางเลือก)

สิ่งที่ต้องเตรียมก่อน
1. โปรแกรม ชื่อ SubExtractor
https://www.videohelp.com/software/SubExtractor

โหลดได้ที่นี้ https://www.videohelp.com/software/SubExtractor ชื่อเต็มๆคือ Subtitle Extractor
2. Windows 7 ทำไมใช้ Windows XP ไม่ได้ล่ะ เหตุเพราะว่า Windows XP พิมพ์สระต่างๆ แล้วไม่แสดงเป็นตัวอักษรถ้าไม่มีตัวอักษรนำหน้า เพราะว่าโปรแกรมนี้จะเรียนรู้ทีละตัวอักษรที่พิมพ์ลงเท่านั้น

เมื่อเตรียมเรียบร้อยแล้วมาเริ่มกันเลย
เปิดโปรแกรมมาจะได้ หน้าตาแบบนี้ (ผมตัดส่วนขอบขวาออกไปนะครับ)


เมื่อกดปุ่ม [Browse...] แล้วจะได้


เมื่อเลือกไฟล์แล้วจะแสดงหน้าตาแบบนี้

เมื่อตรวจดูว่าเป็นซับที่ต้องการแปลง คลิ๊กปุ่ม [Next Step]

โปรแกรมจะเริ่มการทำ OCR ในหน้าตานี้ครับ

ตัวอย่าง


อีกตัวอย่าง

ถ้าเกิดโปรแกรมเจอแบบนี้ ก็กดปุ่ม [Split in 2] แล้วระบายสีเขียวที่ตัวอักษร หรือสระก็ได้ เพียงตัวเดียวพอ เสร็จแล้วกดปุ่ม [Save Split]
เช่น ผมระบายสีที่ตัวอักษร ส แล้ว [Save Split] โปรแกรมจะให้ตัวอักษรตัว ส เสร็จแล้ว มันจะให้เราใส่ สระอื กับไม้โท แต่ใส่ไม่ได้
เพราะว่ามันเป็นรูปเดียวกันอยู่ ก็กดปุ่ม [Split in 2] อีกครั้ง แล้วระบายสีที่สระ อื หรือ ไม้โท ก็ได้ แล้ว Save Split โปรแกรมจะให้เราใส่ สระอื และไม้โท ทีละตัว

อีกนิดครับ อาจจะติดตัวต่อไปนี้ ถ้าซับบรรทัดนั้นๆ ไม่มีตัว " หรือ ' ในส่วนปิดประโยค เช่น "ชัคบอกว่า  แล้วจบบรรทัดไปโปรแกรมจะแจ้งว่า ตัวอักษรไม่ครบ ให้กด ปุ่ม Check box ที่แสดงขึ้นมา เหนือตาราง ABC ครับโปรแกรมก็จะทำการ OCR ต่อไปครับ

เมื่อโปรแกรมทำ OCR เสร็จแล้ว ทำตามภาพเลยครับ



จากรูปสุดท้ายถ้าเราเลือกไฟล์ซับมาแค่ไฟล์เดียว ปุ่ม [OCR Next Title] จะไม่สามารถกดได้ ให้ไปคลิ๊กที่ [Jump to Step] แล้วเลือก [Load Subtitle File]

เสร็จแล้วครับ
โปรแกรมนี้ผมลองใช้แล้วแปลงได้เร็วดี ง่ายกว่า SubtitleEdit ผมแปลงซีรี่ย์จำนวน 24 ตอนใช้เวลา ครึ่งชั่วโมงก็เสร็จ
ถ้าอ่านแล้วไม่เข้าใจหรือติดตรงไหน ถามได้ครับ ถ้าผมเคยเจอนะ


ตัวอย่าง รวมตัวอักษรให้เป็น หนึ่งตัว
ภาษาไทย เช่น ตัวอักษร ญ, ฐ, สระอำ, สระอะ, สระแอ
ภาษาอังกฤษ เช่น ", :, %, =, !, ?

-


ตัวอย่าง การแยกส่วนที่ถูกวิธี


ตัวอย่าง โปรแกรมแบ่งตัวหนังสือแล้ว แสดงข้อมูลการแบ่งผิดตรงมุมขวาบน (ตัวหนังสือสีน้ำเงิน) หลังจากกดปุ่ม [Split in 2]
1

2

วิธีแก้ ให้ระบายสีตรงส่วนที่มันระบาย โปรแกรมจะเปลี่ยนตัวอักษรให้ ถ้ายังแสดงไม่ถูกให้ระบายสีใหม่เอง

ขออภัย! โพสต์นี้มีไฟล์แนบหรือรูปภาพที่ไม่ได้รับอนุญาตให้คุณเข้าถึง

คุณจำเป็นต้อง ลงชื่อเข้าใช้ เพื่อดาวน์โหลดหรือดูไฟล์แนบนี้ คุณยังไม่มีบัญชีใช่ไหม? ลงทะเบียน: New Member Sign in with facebook

x

คะแนน

3

ดูบันทึกคะแนน

มีใครบ้างนะ อ่านกระทู้นี้ มุมมองรูปประจำตัว มุมมองรายการ
phanoom โพสต์ 22-8-2012 00:37:07
แก้ไขครั้งสุดท้ายโดย phanoom เมื่อ 22-8-2012 00:44

ไปลองทำมาแล้วจ๊ะ
- บอกคำเดียวว่าโปรแกรมเทพมากๆ OCR ยังกะติดจรวดไอพ่น
- เราลองทำ OCR เรื่อง Band.Of.Brothers.2001.Ep10.Points.BluRay.1080p.x264.DTS-WiKi
- ไวมากพิมพ์ไม่กี่ตัวเอง ไม่ถึง 10 นาที เสร็จแล้วเหรอ..
- มีคำผิดน้อยมาก แทบจะไม่มีเลย ติดตัวไม้เอกตัวเดียวมันไม่ยอมอ่านให้ คิดว่าต้องมานั่งพิมพ์ไม่เอกทีหลัง
- ลองเอาซับ OCR มาเปิดดู มีไม่เอกครบเฉยเลย ยังงงๆ ว่ามาได้ไง เฟอร์เฟ็คสุด
- ตอนนี้ได้โปรแกรมนี้ คงต้องรื้อซับ DVD ที่โมใส่หนังเก็บไว้ เอามาทำซับสวยๆ คมๆ ใช้งานใหม่อีกรอบแล้ว
- ได้ทั้ง SRT / ASS / ไปแปลงทำ PGS + Vobsub แบบ 1080p. ใช้งานได้แจ่มๆ ไปเลย
- ขอบคุณในน้ำใจท่านจริง ที่เอาความรู้ และโปรแกรมดีๆ มาแบ่งปันกันใช้งาน สวรรณ์มาโปรดจริงๆ


ปล. อันนี้เสริมนิดนึง พอดีตอนที่เราลงโปรแกรม มันถามหา NET Framework Version 4 ต้องลงตัวนี้ด้วย
      เผื่อใครไม่มีเลยเอามาฝากกันจ้า ลงเสร็จแล้ว รีสตาร์จคอม แล้วเข้ามารันโปรแกรม SubExtractor ได้เลยจ๊ะ
      เราใช้กับ Win7 64Bit Ram8GB ได้ไม่มีปัญหา


http://www.microsoft.com/en-us/download/details.aspx?id=17851
http://www.x64bitdownload.com/do ... nload-yejevppa.html
http://www.filehippo.com/download_dotnet_framework_4/



แสดงความคิดเห็น

น่ารักที่สุด  โพสต์ 25-8-2012 01:17
FreeAndFree โพสต์ 27-8-2012 20:37:25
วันก่อนอยากลองเล่นๆ เพราะเห็นว่าขนาดซับจากดีวีดียังเร็วขนาดนี้
แล้วถ้าเป็นซับจำพวก 1080p จะเร็วสักแค่ไหน (ตามที่คิดเองน่าจะเร็วขึ้น
เพราะตัวหนังสือคมกว่า)   ผลปรากฏว่าเราต้องสอนมันแทบจะทุกตัว
แม้แต่ตัวอักษรที่สอนมันไปแล้ว  ไม่ทราบต้องตั้งค่าอะไรยังไงครับ
พอมีใครจะแนะนำได้บ้างครับ

แสดงความคิดเห็น

ลองโหลดเวอร์ชั่น Beta ตัว 1.0.2.9 ดูครับ  โพสต์ 28-8-2012 09:02
ย่อซับลงมาเป็น 480p หรือ 720p แล้วลองดูใหม่รึยังครับ  โพสต์ 27-8-2012 21:47
Jingjok โพสต์ 28-8-2012 11:29:07
FreeAndFree ตอบกลับเมื่อ 27-8-2012 20:37
วันก่อนอยากลองเล่นๆ เพราะเห็นว่าขนาดซับจากดีวีดียั ...

สังหรณ์เหมือนกันว่าพอฐานข้อมูลมากขึ้นเรื่อย ๆ มันจะทำให้เพี้ยนเหมือนโปรแกรม OCR เอกสารทั่ว ๆ ไปหรือเปล่า

ผมเลยใช้วิธีแยกฐานข้อมูลเป็นเรื่องๆ แบบ Subtitle Edit

ลองดูนะครับ
1.ให้ Windows แสดงไฟล์ที่ซ่อนก่อน
2.ก่อนอื่นให้ลบฐานข้อมูลที่ติดมากับโปรแกรม มันจะเป็นไฟล์ชื่อ OcrMapOrig.bin ขนาดประมาณ 17 MB อยู่ในโฟลเดอร์ที่ติดตั้งโปรแกรมนั่นแหละครับ เพราะถ้าไม่ลบไฟล์นี้ ฐานข้อมูลของแต่ละเรื่องก็จะมีขนาดเริ่มต้น 17 MB ขั้นตอนนี้จะไม่ทำก็ได้ แต่มันจะเปลืองเนื้อที่ HD ไปเปล่า ๆ
3.ไปที่โฟลเดอร์ Users->(ชื่อผู้ใช้)->AppData->Local
4.จะเห็นไฟล์ชื่อ OcrMap.bin (ไฟล์นี้แหละครับที่เป็นตัวเก็บฐานข้อมูลที่เราทำไปแล้ว) ก็ให้เปลี่ยนชื่อไฟล์นี้ซะ อาจจะเพิ่ม (จุด)(ชื่อหนัง) ต่อท้ายไฟล์แบบผมก็ได้ครับ

5.ที่นี้พอเข้าโปรแกรม SubExtractor มันจะสร้างไฟล์ OcrMap.bin ขึ้นมาใหม่ ก็ทำ OCR ไปจนเสร็จ แล้วก็ไปเปลี่ยนชื่อไฟล์ตามข้อ 4
6.ก็จะได้ฐานข้อมูลแยกเป็นเรื่อง ๆ คล้าย Subtitle Edit ถ้าไปเจอซับที่ตัวคล้าย ๆ กับหนังที่เราทำไปแล้วก็ค่อยมาเปลี่ยนชื่อไฟล์ให้กลับมาเป็น OcrMap.bin ก่อนที่จะทำ OCR

หมายเหตุ : ผมลองทำกับไฟล์ 1080p พอเจอวรรณยุกต์ มันต้องคอยคลิก Ignore Baseline ตลอดเลยครับ ยังไม่ทราบวิธีแก้เหมือนกัน

ขออภัย! โพสต์นี้มีไฟล์แนบหรือรูปภาพที่ไม่ได้รับอนุญาตให้คุณเข้าถึง

คุณจำเป็นต้อง ลงชื่อเข้าใช้ เพื่อดาวน์โหลดหรือดูไฟล์แนบนี้ คุณยังไม่มีบัญชีใช่ไหม? ลงทะเบียน: New Member Sign in with facebook

x

แสดงความคิดเห็น

เจอทางตันเหมือนกันครับ วรรณยุกต์ ต้องคอยคลิก Ignore Baseline ตลอดเลย  โพสต์ 3-10-2012 16:25
ขอขอบคุณ คุณ Jingjok จริงๆ ครับที่เป็นธุระให้ขนาดนี้ เดี๋ยวขอไปลองดูครับ  โพสต์ 28-8-2012 12:51
ลองแยกฐานข้อมูลดูแล้ว ยังเพี้ยนไหม  โพสต์ 28-8-2012 11:47
dylanja โพสต์ 21-8-2012 12:06:16
น่าสนดีเหมือนกัน เดี๋ยวว่าง ๆ คงต้องลองขอลองหน่อย เผื่อเป็นทางเลือกที่ดีกว่า ขอบคุณมากครับ

แสดงความคิดเห็น

มันเจ๋งมาก อย่าเสียเวลากับตัวเก่าเลยครับ ให้คะแนน 10/10 เลยครับ  โพสต์ 21-8-2012 15:54
vicvicky โพสต์ 21-8-2012 12:23:06
ขอบคุณมากครับ
non_naja โพสต์ 21-8-2012 13:54:15
ผมสนับสนุนให้แปลงไฟล์เป็น srt นะ เพราะใช้งานง่าย ตัวอักษรคมชัดบาดใจ อิอิ
apollo14 โพสต์ 21-8-2012 15:09:09
ว้าวๆ ๆ ๆ ง่ายมากๆ จริงๆ ด้วยครับ
ดีกว่า SubtitleEdit จริงๆ

ทีแรก ยังงงๆ กะระบบ นิดหน่อย พอจับทางได้เท่านั้นแหละ ทำเรื่องละแค่ 5 นาที เสร็จ แถมยังแทบจะไม่มีผิดเลย

สุดยอดๆๆๆๆ

ขอบคุณผู้แนะนำด้วยนะครับ

แสดงความคิดเห็น

ก็ลองดูสิครับ แล้วจะรู้ว่า สวรรค์มีจริง อิอิ  โพสต์ 21-8-2012 16:21
เรื่องละ 5 นาที ฟังดูเข้าท่าครับ   โพสต์ 21-8-2012 15:56
Dnxy โพสต์ 21-8-2012 15:13:37
ง่าย เร็ว สุดยอด ขอบคุณมากครับ
dylanja โพสต์ 21-8-2012 15:55:22
โอ้ว... คณะเทพมายืนยันกันเพียบ สงกะสัยเจ๋งจริง
apollo14 โพสต์ 21-8-2012 16:38:02
apollo14 ตอบกลับเมื่อ 21-8-2012 15:09
ว้าวๆ ๆ ๆ ง่ายมากๆ จริงๆ ด้วยครับ
ดีกว่า SubtitleEdit จริงๆ
...

ยิ่งทำหลายเรื่องยิ่งเร็วครับ เพราะมันจำตัวเก่าได้ ผมนั่งทำแป็บเดียวได้ 4 เรื่องละ

แสดงความคิดเห็น

ที่นี้เว็บบอร์ดน่าจะเพียบไปด้วย SRT แน่ เยี่ยมไปเลยครับ   โพสต์ 21-8-2012 16:49
ติดใจล่ะสิครับ ว่าแต่เมื่อก่อนใช้เวลาเท่าไรครับ  โพสต์ 21-8-2012 16:48
phanoom โพสต์ 21-8-2012 19:10:51
ต้องลองๆ ยืนยัน กันแบบนี้ ต้องของดีแท้แน่นอน
ขอบใจมากนะจ๊ะที่เอามาแบ่งปัน สิ่งดีๆ ให้แก่กัน
ท่าทางจะทำ SRT กันมันส์แน่ๆ
ตอนแรกใช้ SubtitleEdit ใช้เวลา 30-60 นาที แถมคำผิดเยอะแยะ
เห็นว่าโปรแกรมนี้ใช้เวลาแค่ 10-15 นาที คำผิดน้อยๆ นี่มันโปรแกรมเทพชัดๆ อิอิ
จัดไปๆ อย่าให้เสียของดีๆ Thank You

แสดงความคิดเห็น

เห็นบอกว่า บางเรื่องใช้เวลาแค่ 2-3 นาทีเองครับ  โพสต์ 22-8-2012 08:07
ลองแล้วมาบอกด้วยนะ  โพสต์ 21-8-2012 22:20
daimondus โพสต์ 21-8-2012 19:42:29
โปรแกรม เมพมาก ไวมากในการแกะตัวหนังสือ
แต่ติดที่ตัวสระ ที่มันยังต้องมาตามแก้อยู่

แสดงความคิดเห็น

สุดจะบรรยายครับ ขอบคุณสำหรับสิ่งดีๆ เทพจริงๆ  โพสต์ 17-9-2012 06:06
12345678ถัดไป
B Color Image Link Quote Code Smilies

รายละเอียดเครดิต


GMT+7, 2-7-2020 16:02 ใช้เวลาโหลดหน้านี้ 0.060521 วินาที, 24 คำร้อง .

1080iP Powered By Discuz! + Light B1.4.7.1

รายละเอียด/ข้อตกลงการใช้งาน

แจกฟรี!

ผู้ใช้งานสามารถนำส่วนเสริมนี้ไปใช้งานได้ฟรีโดยยังคงเครดิตจากแหล่งที่มาไว้

เราพัฒนาอย่างไม่หยุดยั้ง

ใช้งาน Css Framework : UIKIT 3.5.3 (May 29, 2020)


Build Version

ขณะนี้คุณกำลังใช้งาน Light Build 1.4.7.1


Discuz!

Discuz! X3.4 R20191201, Rev.61

GMT+7, 2-7-2020 16:02 , Processed in 0.060537 second(s), 24 queries .