daimondus
โพสต์ 25-8-2012 22:43:32
ถ้าแก้ไขโปรแกรมได้นี่คงแจ่ม
เปลี่ยนไอ้แผงภาษาอังกฤษออก เอาภาษาไทยแทนเข้าไป
ทีนี้ ปัญหาเรื่องสระ คงหมดไปแน่นอน เหอๆ
An_ant
โพสต์ 26-8-2012 09:19:58
อยากได้ หรือพอทราบวิธีแก้ไข
ๆ อยากได้เว้นหน้าหลังหนึ่งเคาะ
ฯ เว้นหลังหนึ่งเคาะ
เหลือปัญหาตรงนี้ กับเออเร่ออีกนิดหน่อย
Subitle file out of date
FreeAndFree
โพสต์ 27-8-2012 20:37:25
วันก่อนอยากลองเล่นๆ เพราะเห็นว่าขนาดซับจากดีวีดียังเร็วขนาดนี้
แล้วถ้าเป็นซับจำพวก 1080p จะเร็วสักแค่ไหน (ตามที่คิดเองน่าจะเร็วขึ้น
เพราะตัวหนังสือคมกว่า) ผลปรากฏว่าเราต้องสอนมันแทบจะทุกตัว
แม้แต่ตัวอักษรที่สอนมันไปแล้วไม่ทราบต้องตั้งค่าอะไรยังไงครับ
พอมีใครจะแนะนำได้บ้างครับ:L
FreeAndFree
โพสต์ 27-8-2012 22:08:32
FreeAndFree ตอบกลับเมื่อ 27-8-2012 20:37 static/image/common/back.gif
วันก่อนอยากลองเล่นๆ เพราะเห็นว่าขนาดซับจากดีวีดียั ...
ลองหมดแล้วครับ ทั้งจากซับ 1080p แท้ และที่โมกันเอง
แปลงกลับไปที่ 720p และ 480p ผลก็เหมือนเดิมครับ
Jingjok
โพสต์ 28-8-2012 11:29:07
FreeAndFree ตอบกลับเมื่อ 27-8-2012 20:37 static/image/common/back.gif
วันก่อนอยากลองเล่นๆ เพราะเห็นว่าขนาดซับจากดีวีดียั ...
สังหรณ์เหมือนกันว่าพอฐานข้อมูลมากขึ้นเรื่อย ๆ มันจะทำให้เพี้ยนเหมือนโปรแกรม OCR เอกสารทั่ว ๆ ไปหรือเปล่า
ผมเลยใช้วิธีแยกฐานข้อมูลเป็นเรื่องๆ แบบ Subtitle Edit
ลองดูนะครับ
1.ให้ Windows แสดงไฟล์ที่ซ่อนก่อน
2.ก่อนอื่นให้ลบฐานข้อมูลที่ติดมากับโปรแกรม มันจะเป็นไฟล์ชื่อ OcrMapOrig.bin ขนาดประมาณ 17 MB อยู่ในโฟลเดอร์ที่ติดตั้งโปรแกรมนั่นแหละครับ เพราะถ้าไม่ลบไฟล์นี้ ฐานข้อมูลของแต่ละเรื่องก็จะมีขนาดเริ่มต้น 17 MB ขั้นตอนนี้จะไม่ทำก็ได้ แต่มันจะเปลืองเนื้อที่ HD ไปเปล่า ๆ :D
3.ไปที่โฟลเดอร์ Users->(ชื่อผู้ใช้)->AppData->Local
4.จะเห็นไฟล์ชื่อ OcrMap.bin (ไฟล์นี้แหละครับที่เป็นตัวเก็บฐานข้อมูลที่เราทำไปแล้ว) ก็ให้เปลี่ยนชื่อไฟล์นี้ซะ อาจจะเพิ่ม (จุด)(ชื่อหนัง) ต่อท้ายไฟล์แบบผมก็ได้ครับ
5.ที่นี้พอเข้าโปรแกรม SubExtractor มันจะสร้างไฟล์ OcrMap.bin ขึ้นมาใหม่ ก็ทำ OCR ไปจนเสร็จ แล้วก็ไปเปลี่ยนชื่อไฟล์ตามข้อ 4
6.ก็จะได้ฐานข้อมูลแยกเป็นเรื่อง ๆ คล้าย Subtitle Edit ถ้าไปเจอซับที่ตัวคล้าย ๆ กับหนังที่เราทำไปแล้วก็ค่อยมาเปลี่ยนชื่อไฟล์ให้กลับมาเป็น OcrMap.bin ก่อนที่จะทำ OCR
หมายเหตุ : ผมลองทำกับไฟล์ 1080p พอเจอวรรณยุกต์ มันต้องคอยคลิก Ignore Baseline ตลอดเลยครับ ยังไม่ทราบวิธีแก้เหมือนกัน :L
Jingjok
โพสต์ 28-8-2012 11:52:56
แก้ไขครั้งสุดท้ายโดย Jingjok เมื่อ 28-8-2012 13:08
Jingjok ตอบกลับเมื่อ 28-8-2012 11:29 static/image/common/back.gif
สังหรณ์เหมือนกันว่าพอฐานข้อมูลมากขึ้นเรื่อย ๆ มันจ ...
ที่ผมลองกับ Die Hard 2 แยกแล้วก็มีเพี้ยนอย่างสระอือกับสระอี กับวรรณยุกต์อยู่ผิดที่ แต่ไม่ต้องคอยสอนมันทุกตัวอักษรเหมือนที่คุณ FreeAndFree เจอครับ
*****************************
เพิ่มเติม ตะกี้ลองอีกโดยใช้ BDSup2Sub แปลงจาก 1080p เป็น 720p แล้วเอาตัว 720p ไป OCR ก็เจออาการเดียวกับคุณ FreeAndFree เลยครับ
An_ant
โพสต์ 31-8-2012 12:15:08
ตัวอย่างคำว่า "ฝั่ง" เป็นแบบนี้ "อีกัฝ่ง" โปรแกรมจะฝากไว้กับตัวหน้าประจำ
เคยลบตัวไหนออกไปไม่รู้ จำไม่ได้ แล้วได้ผล ฝากไว้ด้วยเผื่อใครนึกออก
bkkkjst
โพสต์ 17-9-2012 18:26:38
คำว่า " มหา'ลัย " ใช่สัญลักษณ์อะไร แทน "'" หรอครับ
อยู่ตรงไหน บนแป้นพิมพ์บอกด้วยนะครับ ลอง ไม้เอก( ่ ) กับ single quote( ' ) แล้วก็ไม่ได้
pravut
โพสต์ 19-9-2012 11:20:42
แก้ไขครั้งสุดท้ายโดย pravut เมื่อ 19-9-2012 11:54
ผมลองเล่นดู แต่ติดตั้งแต่ตัวแรกเลย คำว่า ปัดโธ่ มันอ่าน ปั
กด split แล้ว ระบายยังไงก็ไม่รู้จัก ป ปลา แต่มันรู้จัก บ ใบไม้:(
Vista2k7
โพสต์ 19-9-2012 11:34:06
pravut ตอบกลับเมื่อ 19-9-2012 11:20 static/image/common/back.gif
ผมลองเล่นดู แต่ติดตั้งแต่ตัวแรกเลย คำว่า ปัดโธ่ มันอ ...
พอระบายแล้ว ป แล้วไม่รู้จัก มันจะไม่แสดงตรงมุมขวาบน แล้ว กด Save Split แล้วโปรแกรมจะถามเราว่า ป ที่เราระบายไปเป็นตัวอะไร ก็พิมพ์ ป ไป