คำถามนี้ถือได้ว่า เป็นคำถามยอดฮิตติดอันดับต้นๆ เมื่อมีการพูดถึงซอฟต์แวร์ที่ “สามารถอ่านภาษาไทยได้” ในการทดสอบภายในห้องทดสอบของ ABBYY โดยมีเงื่อนไขการทดสอบคือ เอกสารที่นำมาทดสอบจะสแกนด้วยโหมด เฉดเทา ความละเอียดในการสแกนอยู่ที่ 300 จุดต่อนิ้ว ตัวอักษรจะอยู่ระหว่าง 12 – 14 จุด หรือ Point และตัวเอกสารที่นำมาสแกนไม่มีข้อมูลรบกวน หรือ Noise เลย จากการทดสอบด้วยเงื่อนไขทั้ง 4 ทำให้ผลลัพธ์ที่ได้หลังจากการทำ OCR จะได้อยู่ระหว่าง 80 -90% เลยทีเดียว ทางแอดมินเองก็ได้ทดสอบกับฟอนต์ที่ราชการไทยใช้งานบ่อยๆ นั้นก็คือ Th Sarabun ก็ได้ % ความถูกต้องที่นาพึ่งพอใจเป็นอย่างยิ่ง
แต่อย่างไรก็ตาม ABBYY ก็ยังมีเครื่องไม้เครื่องมือ ที่แถมมาในชุดของ ABBYY FineReader เพื่อให้การแก้ไข ปรับปรุงข้อมูลมีความสะดวก รวดเร็ว และสามารถนำกลับมาใช้ใหม่ได้ในอนาคต อย่างคุณสมบัติที่เรียกว่า Pattern Training ซึ่งความสามารถนี้ ABBYY อนุญาตให้เราสามารถบอก ABBYY ได้ว่า ตัวอักษรในแต่ละหน้าเอกสาร แต่ละตัวนั้น ตรงกับตัวอักษรอะไรในภาษาไทย และจากนั้นก็บันทึกแบบแผนของรูปตัวอักษรเหล่านั้น เก็บเป็นฐานข้อมูล เพื่อให้สามารถเรียกกลับมาใช้ใหม่ได้ เมื่อพบเจอเอกสารที่มีฟอนต์เหล่านั้นได้ ในอนาคต เพื่อให้การแปลงข้อมูลเกิดความถูกต้องมากยิ่งขึ้นนั่นเอง