ภาษา 'ไทม์แมชชีน' เป็นหิน Rosetta สำหรับลิ้นที่หายไป

19
05月

หนึ่งในสิ่งที่ฉันชอบเกี่ยวกับการรับชมภาพยนตร์เก่าคือการได้ยินว่าผู้คนเคยพูดในยุคสมัยก่อนอย่างไร - การแสดงออกที่พวกเขาใช้การพูดจาตบเบา ๆ ที่โรงเรียนเก่าของพวกเขา แต่ภาษาจากหลายพันปีที่ผ่านมาเสียงกลับเป็นเช่นไร? ฮอลลีวูดเท่าที่ฉันรู้ยังไม่ได้สร้างภาพยนตร์ที่ตัวละครพูดในโปรโต - ออสเตรียแท้

หิน Rosetta ในพิพิธภัณฑ์บริติช จารึกในอักษรอียิปต์โบราณและ Demotic และกรีกให้เบาะแสแรกในการถอดรหัสของอักษรอียิปต์โบราณอียิปต์ พิพิธภัณฑ์อังกฤษ

ภาษาแปลก ๆ ในตัวฉันจึงตื่นเต้นที่ค้นพบว่านักวิทยาศาสตร์จาก UC Berkeley และ University of British Columbia ได้สร้างโปรแกรมคอมพิวเตอร์ขึ้นมาใหม่เพื่อสร้างคำศัพท์ภาษาโบราณอย่างรวดเร็วโดยใช้เฉพาะลูกหลานของภาษาสมัยใหม่เท่านั้น

โปรแกรมซึ่งเป็นไทม์แมชชีนภาษาแปลก ๆ สามารถบีบอัดข้อมูลได้อย่างรวดเร็วในภาษาโปรโต - ภาษาที่เก่าแก่ที่สุดที่ทำให้เกิดภาษาสมัยใหม่เช่น Hawaiian, Javanese, Malay, Tagalog และอื่น ๆ ที่พูดในเอเชียตะวันออกเฉียงใต้ ของทวีปเอเชียออสตราเลเซียและแปซิฟิก

ความเร็วและขนาดของงานเป็นกุญแจสำคัญที่นี่เนื่องจากภาษาโปรโตมักจะถูกสร้างขึ้นใหม่ผ่านกระบวนการที่ทำด้วยมืออย่างทันเวลาและมีความเพียรที่เกี่ยวข้องกับการเปรียบเทียบสองภาษาขึ้นไปที่ทักทายจากบรรพบุรุษที่แบ่งปัน

"สิ่งที่ทำให้ฉันตื่นเต้นเกี่ยวกับระบบนี้คือต้องใช้ความคิดที่ยอดเยี่ยมจำนวนมากที่นักภาษาศาสตร์มีเกี่ยวกับการสร้างประวัติศาสตร์ขึ้นมาใหม่และมันทำให้ระบบอัตโนมัติเป็นระดับใหม่: ข้อมูลเพิ่มเติมคำเพิ่มเติมภาษามากขึ้น แต่ใช้เวลาน้อยลง" กล่าว ศาสตราจารย์ด้านวิทยาศาสตร์คอมพิวเตอร์ที่ UC Berkeley และผู้ร่วมเขียนบทความในระบบที่ตีพิมพ์ในสัปดาห์นี้ในวารสาร

โปรแกรมอาศัยอัลกอริธึมที่รู้จักกันในนามของตัวอย่าง เพื่อตรวจสอบ ทันสมัยหลายร้อย สำหรับคำพูดของบรรพบุรุษร่วมสมัยจากหลายพันปีย้อนหลัง แบบจำลองการคำนวณขึ้นอยู่กับทฤษฎีภาษาศาสตร์ที่สร้างขึ้นซึ่งคำต่าง ๆ พัฒนาขึ้นราวกับว่าอยู่ตามกิ่งก้านของต้นไม้ลำดับวงศ์ตระกูล

ในเอกสารของพวกเขา (หากคุณต้องการข้อมูลเฉพาะเพิ่มเติมเกี่ยวกับวิธีที่นักวิจัยทำสิ่งต่าง ๆ เช่นเชื่อมโยงปริภูมิเวกเตอร์กับแต่ละหน่วยเสียงอ่าน ) ทีมงานได้ให้รายละเอียดกระบวนการสร้างใหม่มากกว่า 600 ภาษาโปรโต - ออสโตรนีเซีย 140,000 คำ

พวกเขากล่าวว่ามากกว่าร้อยละ 85 ของไทคอนที่มาในลักษณะของภาษาที่ทำด้วยตนเองโดยนักภาษาศาสตร์

อย่างไรก็ตามนักภาษาศาสตร์ไม่จำเป็นต้องกังวลเรื่องการแข่งขันจากคอมพิวเตอร์ "นี่ไม่ใช่ความพยายามที่จะดึงนักภาษาศาสตร์เชิงประวัติศาสตร์ออกจากงาน" ไคลน์บอก CNET “ มันไม่เหมือนหมากรุกที่เราเห็นว่าเราสามารถทำให้มนุษย์เป็นหนึ่งเดียวได้หรือไม่

“ มันใช้เวลานานมากสำหรับคนที่จะสามารถอ้างอิงข้ามทุกภาษาและทุกคำที่เราป้อนเข้าสู่โปรแกรม” ไคลน์กล่าวเสริม "โดยหลักการแล้วมนุษย์สามารถทำเช่นนั้นได้ แต่ในทางปฏิบัติพวกเขาจะไม่ทำเช่นนั้นมนุษย์ไม่เหมาะที่จะบดขยี้ข้อมูลเหล่านี้ทั้งหมดมนุษย์มีความเหมาะสมกับสิ่งอื่น ๆ "

ยกตัวอย่างเช่นพวกเขาสามารถตรวจสอบอิทธิพลทางภาษาคอมพิวเตอร์ที่ยังไม่สามารถเข้าใจได้ - ปัจจัยทางสังคมวิทยาและภูมิศาสตร์ที่นำไปสู่การเปลี่ยนแปลงทางสัณฐานวิทยาที่เปลี่ยนไปพูด "แมว" เป็น "แมวแมว" และวิธีการสะกดคำผิด ที่เขียนด้วย

ผลกระทบสำหรับอนาคตพูด?
"มันเป็นแบบเดียวกับที่นักดาราศาสตร์ไม่ได้ถูกแทนที่ด้วยกล้องโทรทรรศน์คอมพิวเตอร์" ไคลน์กล่าว "เราหวังว่านักภาษาศาสตร์สามารถใช้เครื่องมืออย่างเรา ๆ เพื่อดูเพิ่มเติมในอดีต - และอื่น ๆ ได้เช่นกัน"

เบาะแสจากอดีตใช่ แต่งานอาจสามารถคาดการณ์ได้ว่าภาษาจะเปลี่ยนไปอย่างไรในอนาคตตามที่ รองศาสตราจารย์ด้านจิตวิทยาผู้อำนวยการห้องทดลองการคำนวณทางปัญญาของเบิร์กเลย์และผู้ร่วมเขียนบทความอีกคน

คำถามใดที่ถามคำถาม: Twitter จะพูดอย่างไรดู 6,000 ปีจากนี้?

เคยสงสัยบ้างไหมว่าต้นไม้ตระกูลใดสำหรับภาษา Austronesian มีลักษณะอย่างไร ไม่เป็นไร การดำเนินการของ National Academy of Sciences

แบ่งปันเสียงของคุณ

แท็ก