HL5001 : การวิจัยและพัฒนาระบบล่ามอิเล็กทรอนิกส์
คณะผู้วิจัย : หน่วยปฎิบัติการวิจัยวิทยาการมนุษยภาษา


บทคัดย่อ

          ในยุคปัจจุบัน การใช้เทคโนโลยีสารสนเทศถือได้ว่าเป็นกิจกรรมที่อยู่ในชีวิตประจำวัน การติดต่อระหว่างมนุษย์กับคอมพิวเตอร์มีความสำคัญมากขึ้นๆ เนื่องจากระบบต่างๆมีความซับซ้อนมากขึ้น คนที่สามารถจัดการกับความซับซ้อนได้นั้นมีจำนวนน้อยมาก การพัฒนาให้คอมพิวเตอร์มีความฉลาดมากพอที่จะรับรู้สิ่งที่มนุษย์สื่อสารนั้น จึงเป็นเรื่องสำคัญ เพราะจะทำให้ ช่องว่างการเข้าถึงข้อมูลมีน้อยลง
        โครงงานวิจัยนี้มีวัตถุประสงค์เพื่อพัฒนาระบบล่ามอิเล็กทรอนิกส์ โดยจะต้องอาศัยการพัฒนาระบบตั้งแต่ทฤษฎี ระบบพื้นฐาน คลังข้อมูล จนถึงระบบประยุกต์ เพื่อนำไปใช้ช่วยในการลดช่องว่างของการรับความรู้ทางด้านข้อความและเสียง
 

หลักการและเหตุผล

          ในยุคปัจจุบัน การใช้เทคโนโลยีสารสนเทศถือได้ว่าเป็นกิจกรรมที่อยู่ในชีวิตประจำวัน การติดต่อระหว่างมนุษย์กับคอมพิวเตอร์มีความสำคัญมากขึ้นๆ เนื่องจากระบบต่างๆมีความซับซ้อนมากขึ้น จะมีเพียงคนกลุ่มน้อยที่เข้าใจคอมพิวเตอร์จึงจะสามารถจัดการกับความซับซ้อน นั้น การพัฒนาให้คอมพิวเตอร์มีความฉลาดมากพอที่จะรับรู้สิ่งที่มนุษย์สื่อสารนั้น จึงเป็นเรื่องสำคัญจะทำให้ ช่องว่างการเข้าถึงข้อมูลมีน้อยลง เนื่องจากมนุษย์มีความสามารถในการถ่ายทอดหลากหลาย ไม่ว่าจะออกมาจาก ท่าทาง น้ำเสียง หรือ ข้อความ การพัฒนาให้ระบบสามารถเรียนรู้สิ่งที่มนุษย์ ต้องการสื่อสารจากหลายๆแหล่งส่งข้อมูลจึงเป็นสิ่งจำเป็น เนคเทคได้เริ่มโครงการวิจัยระบบแปลภาษาและเทคโนโลยีเสียงมาระยะหนึ่ง ซึ่งผลลัพธ์ที่ได้ก็เป็นไปอย่างดี มีผู้สนใจนำไปใช้งาน มีผู้นำข้อมูลไปพัฒนาต่อยอด ในระบบแปลภาษานั้น ได้มีการพัฒนา ในรูปแบบของข้อความเป็นลำดับแรก อย่างไรก็ตามการพัฒนาให้รองรับข้อมูลที่มากขึ้น เช่นข้อมูลเสียง ข้อมูลภาพ เป็นสิ่งสำคัญ การวิจัยในภาษาที่มีการใช้งานสูง เช่นภาษาอังกฤษ ภาษาจีน ภาษาญี่ปุ่น ฯลฯ นั้นมีมายาวนานและมีความก้าวหน้าสูง แต่ในภาษาไทย ยังมีสิ่งที่ยังไม่สามารถหาทฤษฎีรองรับอยู่เป็นจำนวนมาก โดยเฉพาะทฤษฎีทางภาษาศาสตร์คำนวณ ดังนั้นการพัฒนาระบบโดยสร้างความสามารถในการวิเคราะห์ สังเคราะห์ภาษาไทยเป็นสิ่งที่จำเป็น การพัฒนาระบบแปลภาษาถือเป็นจุดเริ่มในการพัฒนาระบบที่มีความสัมพันธ์กับภาษา อื่น
        แนวทางการแก้ปัญหาที่ทางห้องวิจัยดำเนินการคือการพัฒนาระบบต่อยอดจาก เดิมที่สามารถแปลข้อความได้เข้าสู่การเพิ่มความสามารถโดยสนับสนุนให้ระบบ สามารถแปลข้อความในรูปเสียงได้ ซึ่งข้อมูลเสียง ถือว่าเป็นข้อมูลขนาดใหญ่และง่ายสำหรับผู้ใช้ในการติดต่อระหว่างมนุษย์กับ เครื่องได้ จะทำให้การเข้าถึงข้อมูลนั้นเป็นไปได้ง่ายขึ้นสำหรับผู้ใช้
        แนวทางการแก้ปัญหาที่ทางห้องวิจัยได้วิเคราะห์จะประกอบด้วยการพัฒนาใน ส่วนต่างๆตั้งแต่พื้นฐานทางทฤษฎีจนถึงระบบสำหรับใช้งานดังนี้
  • การพัฒนาทฤษฎีทางภาษาศาสตร์คำนวณ เช่นทฤษฎีการสร้างคำประสม ทฤษฎีการวิเคราะห์กริยากลุ่ม
  • การพัฒนาข้อมูลพื้นฐาน เช่นคลังข้อมูลประเภทต่างๆ
  • การพัฒนาเครื่องมือสำหรับพัฒนาคลังข้อมูลพื้นฐาน ได้แก่ ระบบช่วยพัฒนาคลังข้อมูลต่างๆ
  • การพัฒนาระบบพื้นฐานสำหรับภาษาไทย ได้แก่ ระบบตัดคำ ระบบตัดประโยค ระบบตัดพยางค์ ระบบตัดเสียง เป็นต้น
  • การพัฒนาระบบสำหรับใช้งาน ได้แก่ ระบบสังเคราะห์เสียงพูด ระบบแปลภาษา ระบบรู้จำเสียงพูด
  • การประยุกต์ใช้งานระบบหลายระบบ ได้แก่ ระบบล่ามอิเล็กทรอนิกส์
   

 

ประเภทของผลผลิต
หน่วยนับ
ปีที่ 1
ปีที่ 2
ปีที่ 3

รวมทั้ง
โครงการ

ต้นแบบ

  - ระดับอุตสาหกรรม (Industrial Prototype)

ต้นแบบ
0
1
1
2

  - ระดับภาคสนาม (Field Prototype)

ต้นแบบ
4
0
1
5

  - ระดับห้องปฏิบัติการ (Lab Prototype)

ต้นแบบ
14
2
1
17
การใช้ประโยชน์เชิงสาธารณประโยชน์
  - การจัดสัมมนา
ครั้ง
1
2
2
5
 
คน
120
100
120
340

บทความทางวิชาการ

  - วารสารระดับนานาชาติ
บทความ
1
2
2
5

  - วารสารระดับชาติ

บทความ
1
1
1
3
การเสนอผลงานในการประชุม

  - การประชุม/สัมมนาระดับนานาชาติ

บทความ
5

12

8

25

  - การประชุม/สัมมนาระดับชาติ
บทความ
1
4
0
5
สิทธิบัตร/อนุสิทธิบัตร/ลิขสิทธิ์/เครื่องหมายการค้า
เรื่อง
0
1
3
4
การผลิตบุคลากร

  - ปริญญาเอก

คน
0
0
0
0

  - ปริญญาโท

คน
0
2
3
5

  - ปริญญาตรี

คน
0
1
1
2
เอกสารทางวิชาการ (Technical Paper)
  - รายงานฉบับสมบูรณ์ (Final Report)
รายงาน
0
0
1
1
  - บันทึกวิจัย (Technical Paper)
เรื่อง
25
8
0
33
หนังสือ/ตำราวิชาการ (Copyright)
เล่ม
1
0
0
1
           



รายงานโครงการวิจัยระบบล่ามอิเล็กทรอนิกส์ฉบับสมบูรณ์ (.pdf)

Patent
  - Almost Deterministic Syntactic Analyzer using Memory-Inductive Categorial Grammar
ระบบวิเคราะห์โครงสร้างประโยคเกือบเชิงกำหนด โดยใช้ระเบียบไวยากรณ์หมวดคำแบบอุปนัยจากความทรงจำ
  - วิธีการป้อนข้อความภาษาไทยบนอุปกรณ์อิเล็กทรอนิกส์แบบพกพาโดยอาศัยหน่วยพยางค์
  - อุปกรณ์และวิธีการสำหรับสกัดคำประสมภาษาไทย
  - Automatic Sentence Segmentation for Lacking Explicit Sentence Boundary Marker Language
ระบบแบ่งประโยคอัตโนมัติสำหรับภาษาไทยที่ไม่มีตัวบ่งประโยคชัดเจน
International Journal
  - Computers and the Thai Language
คอมพิวเตอร์และภาษาไทย
  - Thai speech processing technology: A review
บทรวบรวมเทคโนโลยีการประมวลผลเสียงพูดภาษาไทย
  - Lexical Units for Thai LVCSR
หน่วยคำสำหรับการรู้จำเสียงพูดต่อเนื่องภาษาไทยแบบหลากคำศัพท์
  - Simulated-Data Adaptation for Robust Speech Recognition
การปรับแบบจำลองโดยการจำลองข้อมูลเพื่อการรู้จำเสียงพูดแบบคงทน
  - Simulated-Data ADAPTATION BASED Piecewise Linear Transformation FOR ROBUST SPEECH RECOGNITION
Local Journal
  - Robust Speech Recognition Using KPCA-Based Noise Classification
ระบบรู้จำเสียงพูดแบบคงด้วยการจำแนกสัญญาณรบกวนแบบ KPCA
  - A Survey of Types and Thai Input methods on Mobile Phone in Thailand
รายงานการสำรวจรูปแบบและระบบการป้อนข้อมูลภาษาไทยบนโทรศัพท์เคลื่อนที่ที่มีใช้อยู่ในประเทศไทย
  - The system architecture of LEXiTRON online dictionary version 2009
สถาปัตยกรรมพจนานุกรมเล็กซิตรอนออนไลน์เวอร์ชั่น 2009
International Conference
  - Tree-structured model selection and simulated-data adaptation for environmental and speaker robust speech recognition
  - Development of Generic Drug Tablet Production Expert System
  - Robust Speech Recognition Using Noise-Cluster HMM Interpolation
  - LEXiTRON Vocabulary Suggestion System with Recommendation and Vote Mechanism
ระบบเพิ่มคำศัพท์เล็กซิตรอนกึ่งอัตโนมัติโดยอาศัยการโหวตและระบบแนะนำ
  - การพัฒนาการรู้จำเสียงพูดแบบหน่วยเซกเมนต์ด้วยการแก้ไขเซกเมนต์ที่หายไปในกราฟเซกเมนต์
  - An Expertise-based Vocabulary Suggestion System: A Case Study of LEXiTRON
  - "Memory-Inductive Categorial Grammar: An Approach to Gap Resolution in Analytic-Language Translation"
ระเบียบไวยากรณ์หมวดคำแบบอุปนัยจากความทรงจำ: แนวทางในการแก้ปัญหาการเว้นว่างในเชิงไวยากรณ์ที่เกิดขึ้นในการแปลภาษาตระกูลคำโดด
  - Translation of Noun Phrase from English to Thai using Phrase-based SMT with CCG Reordering Rules
การแปลนามวลีภาษาอังกฤษเป็นไทยด้วยระบบแปลภาษาเชิงสถิติด้วยการเรียงลำดับคำตามกฎที่สร้างขึ้นโดยอาศัย CCG
  - Toward Thai-English Speech Translation
มุ่งสู่การแปลเสียงพูดไทย-อังกฤษ
  - The Design of Lexical Information for Thai to English MT
การออกแบบข้อมูลคำศัพท์สำหรับระบบแปลภาษาอัตโนมัติจากไทยเป็นอังกฤษ
  - Open CCG Workbench and Visualization Tool
  - Automatic Duration Weighting in Thai Unitselection Speech Synthesis
  - "Prosody-based Naturalness Improvement in Thai Unit-selection Speech Synthesis"
การเพิ่มความเป็นธรรมชาติระบบสังเคราะห์เสียงพูดภาษาไทยโดยกรรมวิธีฉันทลักษณ์
  - A Cooperative Work Environment for Translation ~ Integrating MT and TM for Community~
  - Solving Combination of Thai Auxiliary Verb Based on Finite-state Approach
วิธีการแก้ไขการเกิดร่วมของกริยาช่วยภาษาไทยด้วยวิธีการสถานะจำกัด
  - Building a Gold Standard for Thai WordNet
  - A Syntactic Resource for Thai: CG Treebank
แหล่งข้อมูลทางวากยสัมพันธ์ภาษาไทย ธนาคารต้นไม้แบบแคตากอเรียลแกรมม่า
  - Ontology Development for Pharmaceutical Tablet Production Expert System
  - Recognizer for Thai Complex Sentences including Relative Pronouns
ระบบรู้จำประโยคความซ้อนภาษาไทยที่มีประพันธสรรพนาม
  - Speech-to-Speech Translation Activities in Thailand
การวิจัยและพัฒนาล่ามอิเล็กทรอนิกส์ในประเทศไทย
  - "Combined simulated data adaptation and piecewise linear transformation for robust speech recognition"
ระบบรู้จำเสียงพูดโดยการใช้ข้อมูลฝึกฝนจำลองร่วมกับ PLT
  - A Computational Linguistics Study of Compound Nouns in Thai
การศึกษาคำนามประสมภาษาไทยแนวภาษาศาสตร์คอมพิวเตอร์
  - "English-Thai Example-Based Machine Translation using n-gram model"
ระบบแปลภาษาด้วยเครื่องแบบอิงตัวอย่างโดยใช้ตัวแบบเอ็นแกรม
  - Towards Better Language Modeling for Thai LVCSR
สู่การจำลองภาษาที่ดีกว่าสำหรับการรู้จำเสียงพูดต่อเนื่องภาษาไทยหลากคำศัพท์
  - Optimization of TTilt F0 Modeling
Local Conference
  - Advantages of Prosody Mapping in Cross-Language Speech Synthesis
คุณประโยชน์ของการยืมท่วงทำนองเสียงพูดข้ามภาษาสำหรับกระบวนการสังเคราะห์เสียงพูด
  - การแปลภาษาอัติโนมัติเชิงสถิติสำหรับระบบล่ามอิเล็กทรอนิกส์
  - Recent Progress of “Vaja” Thai Text-to-speech Synthesis
ความก้าวหน้าระบบสังเคราะห์เสียงพูดภาษาไทย
  - SNR-based model selection and simulated-data adaptation for robust speech recognition
การรู้จำเสียงพูดโดยการเลือกแบบจำลองเสียงพูดตามระดับสัดส่วนสัญญาณต่อสัญญาณรบกวน
  - Automatic Annotation Inconsistency Detection: an N-Gram-Based Approach
ระบบตรวจจับความไม่สอดคล้องของการกำกับชนิดของคำในคลังข้อมูลทางภาษาโดยอัตโนมัติ โดยใช้แบบจำลองทางสถิติแบบ n-gram
Book
  - Unfolding Linguistics
Industrial Prototype
  - Thai to English Rule-based Machine Translation for Military Purpose
ระบบแปลภาษาอัตโนมัติโดยวิธีการใช้กฎไวยากรณ์สำหรับการใช้งานในกิจการทางทหาร
  - VAJA 5.0
ซอฟต์แวร์ระบบสังเคราะห์เสียงพูดภาษาไทย เวอร์ชั่น 5.0
Field Prototype
  - A protptype for the vocabulary suggestion and user level management for LEXiTRON
ต้นแบบระบบแนะนำคำศัพท์และจัดระดับผู้ใช้เพื่อสนับสนุนเล็กซิตรอน
  - Parsit Webservice HLT version
ภาษิตเว็บเซอร์วิส เวอร์ชั่น HLT
  - A protptype of website recommendation for Parsit community
ต้นแบบระบบแนะนำเว็บไซต์สำหรับชุมชนภาษิต
  - NECTEC-TRUE Thai spontaneous telephone speech corpus
คลังข้อมูลเสียงบทสนทนาผ่านระบบโทรศัพท์สำหรับการรู้จำเสียงพูดภาษาไทย
  - "An english proficiency improvement system using Parsit : Case study of Thammasat Klongluang Wittayakom School"
ระบบช่วยพัฒนาทักษะภาษาอังกฤษด้วยภาษิต กรณีศึกษาสำหรับโรงเรียนธรรมศาสตร์คลองหลวงวิทยาคม
Lab Prototype
  - A distributed word frequency mining
ต้นแบบการตวจนับความถี่ของคำผ่านเครือข่าย
  - monolingual copus for Natural language Processing
คลังข้อความภาษาไทยขนาดใหญ่เพื่อการประมวลผลภาษาธรรมชาติ
  - Chart-based Parser Prototype for Lexicalized Grammar Formalisms
ต้นแบบระบบวิเคราะห์โครงสร้างประโยคแบบอิงแผนผัง สำหรับระเบียบไวยากรณ์ระดับคำ
  - A protptype for parallel corpus based on alignment for Parsit service
ต้นแบบการสร้างคู่การแปลพร้อมทั้งความถี่เพื่อเป็นระบบสนับสนุนภาษิต
  - Framework Prototype of Memory-Inductive Categorial Grammar
ต้นแบบระเบียบไวยากรณ์หมวดคำแบบอุปนัยจากความทรงจำ
  - An Automatic CG Category Annotation Tool for Thai Language
เครื่องมือกำกับข้อมูลทางวากยสัมพันธ์แบบแคตากอเรียลแกรมม่าอัตโนมัติสำหรับภาษาไทย
  - BEST 2009 Thai Word Segmentation Corpus "BEST 2009"
คลังข้อความภาษาไทยแบบแบ่งคำ
  - TSynC-2: Thai Speech Synthesis Corpus Version 2
TSynC-2: คลังข้อมูลสำหรับการสังเคราะห์เสียงพูดภาษาไทยเวอร์ชั่น 2
  - "Categorial Grammar Treebank and Categorial Grammar Supported Parser"
คลังโครงสร้างต้นไม้สำหรับไวยากรณ์แบบแคตากอเรียลแกรมม่าและระบบแจงต้นไม้ ไวยากรณ์อัตโนมัติที่รองรับระเบียบไวยากรณ์แคตากอเรียลแกรมม่า
  - English-Thai bilingual corpus FY 2550
คลังข้อความคู่ภาษาอังกฤษ-ไทยปี 2550
  - Prototype of Almost-Deterministic Parser Generator from Memory-Inductive Categorial Grammar
ต้นแบบระบบสังเคราะห์โปรแกรมวิเคราะห์โครงสร้างประโยคแบบเกือบเชิงกำหนด จากระเบียบไวยากรณ์หมวดคำแบบอุปนัยจากความทรงจำ
  - Pronunciation Dictionary for Thai words
พจนานุกรมคำอ่านภาษาไทย
  - Restricted grammar continuous speech recognition toolkit, iSpeech-R v1.0
เครื่องมือระบบรู้จำเสียงพูดต่อเนื่องแบบจำกัดไวยากรณ์ เวอร์ชั่น 1.0
  - Server based Translation Memory Prototype
ต้นแบบการพัฒนาระบบช่วยแปล
  - A prototype of sentence similarity for translation memory
ต้นแบบวิธีการหาความคล้ายของประโยคสำหรับระบบช่วยแปล
  - n-gram Prototype of Automatic Annotation Inconsistency Detector Using n-Gram-Based Approach
ต้นแบบระบบตรวจจับความไม่สอดคล้องของการกำกับชนิดของคำในคลังข้อมูลทางภาษาโดย อัตโนมัติ โดยใช้แบบจำลองทางสถิติแบบ
  - Chart-based Sentence Realizer Prototype using Combinatory Categorial Grammar
ต้นแบบระบบสังเคราะห์ประโยคแบบอิงแผนผัง โดยใช้ Combinatory Categorial Grammar
Document
  - Guideline for BEST 2009 : Thai Word Segmentation Software Contest
เอกสารแนวทางการแบ่งคำภาษาไทยสำหรับ BEST 2009 : การแข่งขันสุดยอดซอฟแวร์แบ่งคำภาษาไทย
  - "Automatic Annotation Inconsistency Detection: an n -Gram-Based Approach"
วิธีการตรวจจับความไม่สอดคล้องของการกำกับชนิดของคำในคลังข้อมูลทางภาษาโดยอัตโนมัติ โดยใช้แบบจำลองทางสถิติแบบ n-gram
  - "Candidates of Syntactic Gap Are Overloading! How Do We Solve This Problem Almost Deterministically?"
วิธีการแก้ปัญหาการละในเชิงไวยากรณ์ ด้วยการวิเคราะห์โครงสร้างประโยคแบบเกือบเชิงกำหนด
  - Parsit Webservice HLT version
ภาษิตเว็บเซอร์วิส เวอร์ชั่น HLT
  - "Resolving Grammatical Ellipses in Spoken Language Translation using Memory-Inductive Categorial Grammar"
การแก้ปัญหาการละเชิงไวยากรณ์ในการแปลภาษาพูดโดยใช้ระเบียบไวยากรณ์หมวดคำแบบอุปนัยจากความทรงจำ
  - TSynC-2: Thai Speech Synthesis Corpus Version 2
TSynC-2: คลังข้อมูลสำหรับการสังเคราะห์เสียงพูดภาษาไทยเวอร์ชั่น 2
  - Relationships between Speaking Rate and Word Insertion Penalty in Thai Spontaneous Speech Recognition
ความสัมพันธ์ระหว่างอัตราการพูดและค่าปรับการเพิ่มคำในการรู้จำเสียงพูดภาษาไทยแบบเป็นธรรมชาติ
  - Articulatory test for Creating Thai speech corpus (for synthesizer)
การทดสอบสมมติฐานด้านคุณสมบัติพื้นฐานของเสียงเพื่อการสร้างฐานข้อมูลเสียงพูดภาษาไทย สำหรับการสังเคราะห์เสียงพูดภาษาไทย
  - Question Report for Lexitron
บันทึกรายงานการตอบคำถามปัญหาการใช้งาน Lexitron
  - Thai Diphone Synthesizer with Festival 1.4.2
การสร้างและใช้งานฐานข้อมูลเสียงพูดภาษาไทย ชนิด Diphone บนโปรแกรม Festival 1.4.2
  - Manual Installation Kaspersky Program
คู่มือการติดตั้งโปรแกรม Kaspersky
  - VAJA 5.0
โปรแกรมสังเคราะห์เสียงพูดภาษาไทยเวอร์ชัน 5.0
  - TMSERVER : A Translation Memory Add-On for the Parsit Server
ระบบผสมผสานภาษิตกับระบบช่วยแปล
  - Website Recommended System for Parsit users
ระบบแนะนำเว็บไซต์ให้สมาชิกที่ใช้ในระบบแปลภาษา
  - LEXiTRON Website Version 2.2
เว็บไซต์เล็กซิตรอน เวอร์ชั่น 2.2
  - World Cup Machine Translation
ต้นแบบเวบแปลภาษาอังกฤษไทยสำหรับฟุตบอลโลก
  - Experiment of PostEdit
การประเมินผลโปรแกรม PostEdit
  - Thai to English Rule-based Machine Translation for Military Purpose Report
รายงานระบบแปลภาษาอัตโนมัติโดยวิธีการใช้กฎไวยากรณ์สำหรับการใช้งานในกิจการทางทหาร
  - LEXiTRON Support System
ระบบสนับสนุนเล็กซิตรอน
  - Pronunciation Dictionary for Thai words
พจนานุกรมคำอ่านภาษาไทย
  - A DISTRIBUTED WEB MINING SYSTEM
การตรวจนับความถี่จาก search engine ภายนอก
  - Categorial Grammar Dictionary for Rule-based Parser
ข้อมูลทางวากยสัมพันธ์ แบบแคตากอเรียลแกรมม่าของคำไทย สำหรับระบบวิเคราะห์ไวยากรณ์แบบใช้กฎ
  - Translation Information Generating and Accumulating System by using Alignment
ระบบสร้างคู่คำแปลและนับความถี่การแปลโดยอาศัย Alignment
  - Technical Report: English-Thai Bilingual corpus
รายงานเชิงเทคนิคคลังข้อความคู่ภาษาอังกฤษ-ไทย
  - Technical report: Field Prototype “Word Segmentation corpus”
รายงานเชิงเทคนิคต้นแบบภาคสนามคลังข้อความภาษาไทยแบบแบ่งคำ
  - User Manual for HLT File Backup Server (hlt-kxs)
คู่มือการเข้าใช้งานเครื่องสำรองไฟล์ข้อมูลหน่วยปฏิบัติการวิจัย HLT (hlt-kxs)
  - "Application Programming Interface for Chart-based Parser Framework for Lexicalized Grammar Formalisms"
เอกสาร Application Programming Interface สำหรับผู้ใช้ระบบวิเคราะห์โครงสร้างประโยคแบบอิงแผนผัง สำหรับระเบียบไวยากรณ์ระดับคำ
  - "Application Programming Interface for Chart-based Realizer Framework based on Combinatory Categorial Grammar"
เอกสาร Application Programming Interface สำหรับผู้ใช้ระบบสังเคราะห์ประโยคแบบอิงแผนผัง โดยใช้ Combinatory Categorial Grammar
  - Technical manual:Sentential Tagger
คู่มือการใช้งานเครื่องมือช่วยกำหนดขอบเขตประโยคกึ่งอัตโนมัติ
  - "Introduction to Artificial Intelligence and Natural Language Processing"
แนะนำปัญญาประดิษฐ์และการประมวลผลภาษาธรรมชาติ
  - Machanism of Thai-English Machine Translation for Cobra Gold Project
กลไกระบบแปลภาษาอัตโนมัติจากไทยเป็นอังกฤษในโครงการ Cobra Gold
  - Recognizer for Thai Complex Sentences including Relative Pronouns
ระบบรู้จำประโยคความซ้อนภาษาไทยที่มีประพันธสรรพนาม
  - A Computational Linguistics Study of Compound Nouns in Thai
การศึกษาคำนามประสมภาษาไทยแนวภาษาศาสตร์คอมพิวเตอร์

 


รายชื่อโครงการ
รหัสโครงการ
ชื่อโครงการ
HL5001 การวิจัยและพัฒนาระบบล่ามอิเล็กทรอนิกส์
Research and Development on Speech to Speech Translation System
HT5003 การประมวลผลภาษาในภูมิภาคเอเซียสำหรับการพัฒนาคลังข้อมูลและองค์ความรู้ทางด้านภาษา
(Asian applied natural language processing for linguistic diversity and language resource development, ADD)
P0900146 การวัดเปรียบเทียบสมรรถนะเพื่อยกระดับมาตรฐานเทคโนโลยีการประมวลผลภาษาไทย ระยะที่ 1
(Benchmark for enhancing the standard of Thai language processing, BEST)
HT5205 ระบบสืบค้นและทำเหมืองข้อความสำหรับคลังเว็บไทย
(Search engine and text mining on Thai web archive, ArcSearch)
HT5204 ระบบผู้ช่วยออนไลน์ (Online personal assistant, MyAgent)
P0900385 ระบบตอบรับโทรศัพท์อัตโนมัติเพื่อการรายงานข้อมูลแก่ผู้เดินทาง ระยะที่ 3
(Traffic information system in interactive voice response, TISIVR)
(อยู่ระหว่างการยื่นข้อเสนอโครงการ) โปรแกรมวิเคราะห์ความสมบูรณ์ของการออกเสียงในผู้ป่วยที่ผ่านการผ่าตัดในช่องปาก
(Pronunciation assessment program for orally surgical patients, DenPA)
HT5202 Thai translation of BTEC extension (BTEC)
HL5002 โครงการถ่ายทอดผลงานวิจัยและพัฒนาวิทยาการมนุษยภาษา
HT5304 การพัฒนาพจนานุกรมฉากสถานการณ์โดยใช้ Framenet
P0900170 วิจัยพัฒนาเครื่องมือช่วยเสริมการเรียนภาษาอังกฤษสำหรับผู้เรียนชาวไทย
(English enhancement tools for Thai learners, ESL)
(อยู่ระหว่างการยื่นข้อเสนอโครงการ) การพัฒนาระบบล่ามอิเล็กอรอนิกส์ ระยะที่ 2