daimondus โพสต์ 25-8-2012 22:43:32

ถ้าแก้ไขโปรแกรมได้นี่คงแจ่ม
เปลี่ยนไอ้แผงภาษาอังกฤษออก เอาภาษาไทยแทนเข้าไป

ทีนี้ ปัญหาเรื่องสระ คงหมดไปแน่นอน เหอๆ

An_ant โพสต์ 26-8-2012 09:19:58

อยากได้ หรือพอทราบวิธีแก้ไข
ๆ อยากได้เว้นหน้าหลังหนึ่งเคาะ
ฯ เว้นหลังหนึ่งเคาะ



เหลือปัญหาตรงนี้ กับเออเร่ออีกนิดหน่อย
Subitle file out of date

FreeAndFree โพสต์ 27-8-2012 20:37:25

วันก่อนอยากลองเล่นๆ เพราะเห็นว่าขนาดซับจากดีวีดียังเร็วขนาดนี้
แล้วถ้าเป็นซับจำพวก 1080p จะเร็วสักแค่ไหน (ตามที่คิดเองน่าจะเร็วขึ้น
เพราะตัวหนังสือคมกว่า)   ผลปรากฏว่าเราต้องสอนมันแทบจะทุกตัว
แม้แต่ตัวอักษรที่สอนมันไปแล้วไม่ทราบต้องตั้งค่าอะไรยังไงครับ
พอมีใครจะแนะนำได้บ้างครับ:L

FreeAndFree โพสต์ 27-8-2012 22:08:32

FreeAndFree ตอบกลับเมื่อ 27-8-2012 20:37 static/image/common/back.gif
วันก่อนอยากลองเล่นๆ เพราะเห็นว่าขนาดซับจากดีวีดียั ...

ลองหมดแล้วครับ ทั้งจากซับ 1080p แท้ และที่โมกันเอง
แปลงกลับไปที่ 720p และ 480p ผลก็เหมือนเดิมครับ

Jingjok โพสต์ 28-8-2012 11:29:07

FreeAndFree ตอบกลับเมื่อ 27-8-2012 20:37 static/image/common/back.gif
วันก่อนอยากลองเล่นๆ เพราะเห็นว่าขนาดซับจากดีวีดียั ...

สังหรณ์เหมือนกันว่าพอฐานข้อมูลมากขึ้นเรื่อย ๆ มันจะทำให้เพี้ยนเหมือนโปรแกรม OCR เอกสารทั่ว ๆ ไปหรือเปล่า

ผมเลยใช้วิธีแยกฐานข้อมูลเป็นเรื่องๆ แบบ Subtitle Edit

ลองดูนะครับ
1.ให้ Windows แสดงไฟล์ที่ซ่อนก่อน
2.ก่อนอื่นให้ลบฐานข้อมูลที่ติดมากับโปรแกรม มันจะเป็นไฟล์ชื่อ OcrMapOrig.bin ขนาดประมาณ 17 MB อยู่ในโฟลเดอร์ที่ติดตั้งโปรแกรมนั่นแหละครับ เพราะถ้าไม่ลบไฟล์นี้ ฐานข้อมูลของแต่ละเรื่องก็จะมีขนาดเริ่มต้น 17 MB ขั้นตอนนี้จะไม่ทำก็ได้ แต่มันจะเปลืองเนื้อที่ HD ไปเปล่า ๆ :D
3.ไปที่โฟลเดอร์ Users->(ชื่อผู้ใช้)->AppData->Local
4.จะเห็นไฟล์ชื่อ OcrMap.bin (ไฟล์นี้แหละครับที่เป็นตัวเก็บฐานข้อมูลที่เราทำไปแล้ว) ก็ให้เปลี่ยนชื่อไฟล์นี้ซะ อาจจะเพิ่ม (จุด)(ชื่อหนัง) ต่อท้ายไฟล์แบบผมก็ได้ครับ

5.ที่นี้พอเข้าโปรแกรม SubExtractor มันจะสร้างไฟล์ OcrMap.bin ขึ้นมาใหม่ ก็ทำ OCR ไปจนเสร็จ แล้วก็ไปเปลี่ยนชื่อไฟล์ตามข้อ 4
6.ก็จะได้ฐานข้อมูลแยกเป็นเรื่อง ๆ คล้าย Subtitle Edit ถ้าไปเจอซับที่ตัวคล้าย ๆ กับหนังที่เราทำไปแล้วก็ค่อยมาเปลี่ยนชื่อไฟล์ให้กลับมาเป็น OcrMap.bin ก่อนที่จะทำ OCR

หมายเหตุ : ผมลองทำกับไฟล์ 1080p พอเจอวรรณยุกต์ มันต้องคอยคลิก Ignore Baseline ตลอดเลยครับ ยังไม่ทราบวิธีแก้เหมือนกัน :L

Jingjok โพสต์ 28-8-2012 11:52:56

แก้ไขครั้งสุดท้ายโดย Jingjok เมื่อ 28-8-2012 13:08

Jingjok ตอบกลับเมื่อ 28-8-2012 11:29 static/image/common/back.gif
สังหรณ์เหมือนกันว่าพอฐานข้อมูลมากขึ้นเรื่อย ๆ มันจ ...

ที่ผมลองกับ Die Hard 2 แยกแล้วก็มีเพี้ยนอย่างสระอือกับสระอี กับวรรณยุกต์อยู่ผิดที่ แต่ไม่ต้องคอยสอนมันทุกตัวอักษรเหมือนที่คุณ FreeAndFree เจอครับ

*****************************

เพิ่มเติม ตะกี้ลองอีกโดยใช้ BDSup2Sub แปลงจาก 1080p เป็น 720p แล้วเอาตัว 720p ไป OCR ก็เจออาการเดียวกับคุณ FreeAndFree เลยครับ

An_ant โพสต์ 31-8-2012 12:15:08

ตัวอย่างคำว่า "ฝั่ง" เป็นแบบนี้ "อีกัฝ่ง" โปรแกรมจะฝากไว้กับตัวหน้าประจำ

เคยลบตัวไหนออกไปไม่รู้ จำไม่ได้ แล้วได้ผล ฝากไว้ด้วยเผื่อใครนึกออก

bkkkjst โพสต์ 17-9-2012 18:26:38

คำว่า " มหา'ลัย " ใช่สัญลักษณ์อะไร แทน "'" หรอครับ
อยู่ตรงไหน บนแป้นพิมพ์บอกด้วยนะครับ ลอง ไม้เอก( ่ ) กับ single quote( ' ) แล้วก็ไม่ได้

pravut โพสต์ 19-9-2012 11:20:42

แก้ไขครั้งสุดท้ายโดย pravut เมื่อ 19-9-2012 11:54

ผมลองเล่นดู แต่ติดตั้งแต่ตัวแรกเลย คำว่า ปัดโธ่ มันอ่าน ปั
กด split แล้ว ระบายยังไงก็ไม่รู้จัก ป ปลา แต่มันรู้จัก บ ใบไม้:(

Vista2k7 โพสต์ 19-9-2012 11:34:06

pravut ตอบกลับเมื่อ 19-9-2012 11:20 static/image/common/back.gif
ผมลองเล่นดู แต่ติดตั้งแต่ตัวแรกเลย คำว่า ปัดโธ่ มันอ ...

พอระบายแล้ว ป แล้วไม่รู้จัก มันจะไม่แสดงตรงมุมขวาบน แล้ว กด Save Split แล้วโปรแกรมจะถามเราว่า ป ที่เราระบายไปเป็นตัวอะไร ก็พิมพ์ ป ไป
หน้า: 1 2 [3] 4 5 6 7 8
ดูในรูปแบบกติ: วิธีการแปลงซับไทย IDX SUP เป็น SRT หรือ text (DVD Sub Extractor OCR subtitle IDX SUP to text)