Google กำลังผลักดัน WAXAL ชุดข้อมูลเสียงพูดแบบโอเพนซอร์สจาก Google Research Africa ที่รองรับภาษาพื้นเมืองแอฟริกันหลายภาษาGoogle กำลังผลักดัน WAXAL ชุดข้อมูลเสียงพูดแบบโอเพนซอร์สจาก Google Research Africa ที่รองรับภาษาพื้นเมืองแอฟริกันหลายภาษา

Google ต้องการสอน AI ให้รู้จักภาษาในแอฟริกากว่า 2,000 ภาษาอย่างไร

2026/02/12 21:33
3 นาทีในการอ่าน

[[OPEN_1]]

[[CLOSE_1]]เมื่อ Abdoulaye Diack ผู้จัดการโครงการที่ Google Research ซึ่งเป็นส่วนหนึ่งของ Google ที่อุทิศตนเพื่อพัฒนาความก้าวหน้าทางวิทยาการคอมพิวเตอร์และนำความก้าวหน้าเหล่านั้นมาประยุกต์ใช้กับปัญหาในโลกจริง พูดถึงต้นกำเนิดของ WAXAL ซึ่งเป็นชุดข้อมูลเสียงพูดแบบโอเพนซอร์สจาก Google Research Africa เขาเริ่มต้นด้วยคำเดียว[[OPEN_2]] [[CLOSE_2]][[OPEN_3]]

[[CLOSE_3]] [[OPEN_4]]

[[CLOSE_4]]"WAXAL แปลว่า 'การพูด'" เขาบอกกับ TechCabal โดยระบุว่ามีรากศัพท์มาจากภาษาวูลอฟ ซึ่งเป็นภาษาที่ใช้กันอย่างแพร่หลายในภูมิภาคเซเนแกมเบีย[[OPEN_5]] [[CLOSE_5]][[OPEN_6]]

[[CLOSE_6]] [[OPEN_7]]

[[CLOSE_7]]ชื่อนี้ซึ่งถูกเลือกในปี 2020 โดย Moustaph Cisse หัวหน้านักวิจัยชาวเซเนกัลที่ Google สะท้อนความจริงที่ใหญ่กว่าเกี่ยวกับเส้นทาง AI ของแอฟริกา: ในทวีปที่มีภาษามากกว่า 2,000 ภาษา ซึ่งส่วนใหญ่เป็นภาษาพูดมากกว่าภาษาเขียน เสียงพูดไม่ใช่ตัวเลือก แต่เป็นจุดเริ่มต้น[[OPEN_8]]

[[CLOSE_8]] [[OPEN_9]]

[[CLOSE_9]]มาหลายปีแล้วที่เทคโนโลยีดิจิทัลมุ่งเน้นไปที่การรู้หนังสือ แป้นพิมพ์ และข้อความ แต่ในแอฟริกา ภาษามีชีวิตอยู่ในการสนทนา ทั่วทั้งตลาด ฟาร์ม คลินิก และบ้านเรือน AI ที่ไม่สามารถแยกแยะสำเนียง ระดับเสียง หรือการสลับภาษาไม่สามารถให้บริการแอฟริกันส่วนใหญ่อย่างมีความหมาย WAXAL มุ่งหวังที่จะเปลี่ยนแปลงสิ่งนั้น แทนที่จะมุ่งเน้นเฉพาะการแปลข้อความ โครงการนี้กำลังสร้างโครงสร้างพื้นฐานสำหรับ AI แบบเสียงพูดต่อเสียงพูดในภาษาแอฟริกันที่มีทรัพยากรน้อย โดยมุ่งเน้นที่การสร้างศูนย์กลาง "วัตถุดิบ" ทางภาษาที่กว้างขวางและมีคุณภาพสูง[[OPEN_10]]

[[CLOSE_10]] [[OPEN_11]]

[[CLOSE_11]]"การมี AI ที่สามารถพูดกับเราในภาษาของเราและเข้าใจเรา ไม่ว่าจะเป็นสำเนียงหรือระดับเสียงของเรา เป็นสิ่งที่สำคัญมาก" Diack กล่าว[[OPEN_12]]

[[CLOSE_12]] [[OPEN_13]]

[[CLOSE_13]][[OPEN_14]][[CLOSE_14]]ข้อเสียด้านข้อมูล[[OPEN_15]][[CLOSE_15]][[OPEN_16]]

[[CLOSE_16]] [[OPEN_17]]

[[CLOSE_17]]ความท้าทายเริ่มต้นด้วยความไม่สมดุลอย่างชัดเจน มากกว่า 50% ของเว็บไซต์ทั้งหมดเป็นภาษาอังกฤษและภาษาตะวันตกเพียงไม่กี่ภาษา ภาษาแอฟริกันมากกว่า 2,000 ภาษาแทบไม่ปรากฏในชุดข้อมูลดิจิทัลทั่วโลก ส่วนใหญ่ไม่ได้รับการแทนค่าเพียงพอบนออนไลน์ หลายภาษาไม่มีการเขียนอย่างกว้างขวาง บางภาษาไม่มีการกำหนดมาตรฐานเลย[[OPEN_18]]

[[CLOSE_18]] [[OPEN_19]]

[[CLOSE_19]]หากโมเดล AI ได้รับการฝึกอบรมจากข้อความดิจิทัล และข้อความดิจิทัลแทบไม่มีอยู่สำหรับภาษาแอฟริกัน ทวีปนี้ก็เริ่มต้นการแข่งขัน AI ในข้อเสียเปรียบเชิงโครงสร้าง[[OPEN_20]]

[[CLOSE_20]] [[OPEN_21]]

[[CLOSE_21]]"นี่ไม่ใช่ปัญหาใหม่" Diack กล่าว "นักวิจัยต่างตระหนักถึงช่องว่างมหาศาลในการขาดแคลนข้อมูล"[[OPEN_22]]

[[CLOSE_22]] [[OPEN_23]]

[[CLOSE_23]]หากไม่มีข้อมูล ก็ไม่สามารถฝึกโมเดลได้ หากไม่มีโมเดลที่ได้รับการฝึกอบรม ระบบ AI ก็จะได้ยินผิด แปลผิด หรือเพิกเฉยต่อประชากรทั้งหมด Diack เล่าถึงความหงุดหงิดที่พบบ่อย: การพูดด้วยสำเนียงแอฟริกันที่พูดภาษาฝรั่งเศส ขณะที่ระบบ AI สำหรับจดบันทึกพยายามที่จะเข้าใจเขา เทคโนโลยีมีอยู่แล้ว แต่ไม่ได้รับการปรับแต่งให้เหมาะกับบริบทท้องถิ่น[[OPEN_24]]

[[CLOSE_24]] [[OPEN_25]]

[[CLOSE_25]]ช่องว่างนั้นคือสิ่งที่ WAXAL ต้องการปิด[[OPEN_26]]

[[CLOSE_26]] [[OPEN_27]]

[[CLOSE_27]][[OPEN_28]][[CLOSE_28]]การสร้างรากฐานการพูด[[OPEN_29]][[CLOSE_29]][[OPEN_30]]

[[CLOSE_30]] [[OPEN_31]]

[[CLOSE_31]]เปิดตัวอย่างเป็นทางการในเดือนกุมภาพันธ์ 2026 หลังจากพัฒนามา 3 ปี WAXAL ได้ผลิตชุดข้อมูลเสียงพูดที่ใหญ่ที่สุดชุดหนึ่งสำหรับภาษาแอฟริกันจนถึงปัจจุบัน: เสียงพูดที่บันทึกไว้มากกว่า 11,000 ชั่วโมงจากการบันทึกแต่ละครั้งเกือบ 2 ล้านครั้ง ครอบคลุมภาษาแอฟริกันใต้สะฮารา 21 ภาษา รวมถึงภาษาเฮาซา โยรูบา ลูกันดา และอาโชลี[[OPEN_32]]

[[CLOSE_32]] [[OPEN_33]]

[[CLOSE_33]]นอกเหนือจากการรวบรวมเสียงพูดทั่วไปแล้ว Google กล่าวว่าได้ลงทุนมากกว่า 20 ชั่วโมงในการบันทึกเสียงในสตูดิโอคุณภาพสูงเพื่อพัฒนาเสียงสังเคราะห์ที่ฟังดูเป็นธรรมชาติสำหรับผู้ช่วยเสียง การบันทึก "studio premium" เหล่านี้ได้รับการออกแบบมาเพื่อให้การตอบสนองของ AI ฟังดูเหมือนหุ่นยนต์น้อยลงและมีความถูกต้องทางวัฒนธรรมมากขึ้น[[OPEN_34]]

[[CLOSE_34]] [[OPEN_35]]

[[CLOSE_35]]Google จัดโครงสร้างริเริ่มนี้เป็นรูปแบบความร่วมมือ มหาวิทยาลัยเช่นมหาวิทยาลัย Makerere ในยูกันดาและมหาวิทยาลัยกานาเป็นผู้นำการรวบรวมข้อมูลส่วนใหญ่ พันธมิตรท้องถิ่นเก็บความเป็นเจ้าของชุดข้อมูล ซึ่งได้รับการเผยแพร่แบบโอเพนซอร์สภายใต้ใบอนุญาตที่อนุญาตให้ใช้ในเชิงพาณิชย์[[OPEN_36]]

[[CLOSE_36]] [[OPEN_37]]

[[CLOSE_37]]"เราให้คำแนะนำและเงินทุนเป็นหลัก" Diack อธิบาย "ชุดข้อมูลทั้งหมดนี้ไม่ได้เป็นของเรา แต่เป็นของพันธมิตรที่เราทำงานด้วย"[[OPEN_38]]

[[CLOSE_38]] [[OPEN_39]]

[[CLOSE_39]]ความทะเยอทะยานไม่ได้แค่เพื่อเลี้ยงผลิตภัณฑ์ของ Google เองเท่านั้น แต่เพื่อปลูกฝังระบบนิเวศ[[OPEN_40]]

[[CLOSE_40]] [[OPEN_41]]

[[CLOSE_41]]ภายในไม่กี่วันหลังจากเปิดตัว ชุดข้อมูลมีการดาวน์โหลดมากกว่า 4,000 ครั้ง ซึ่งเป็นสัญญาณเริ่มต้นของการรับเข้าใช้ของนักวิจัยและนักพัฒนา ตามที่ Diack กล่าว[[OPEN_42]]

[[CLOSE_42]] [[OPEN_43]]

[[CLOSE_43]][[OPEN_44]][[CLOSE_44]]ทำไมเสียงพูดจึงสำคัญ[[OPEN_45]] [[CLOSE_45]][[OPEN_46]][[CLOSE_46]][[OPEN_47]]

[[CLOSE_47]] [[OPEN_48]]

[[CLOSE_48]]Google มีเครื่องมือแปลภาษาในหลายภาษาอยู่แล้ว แล้วทำไมต้องเริ่มต้นใหม่ตั้งแต่ต้น?[[OPEN_49]]

[[CLOSE_49]] [[OPEN_50]]

[[CLOSE_50]]เพราะการแปลไม่ใช่การพูด[[OPEN_51]]

[[CLOSE_51]] [[OPEN_52]]

[[CLOSE_52]]การแปลด้วยเครื่องแบบดั้งเดิมอาศัย "ข้อความขนาน" ประโยคที่เขียนในภาษาหนึ่งซึ่งจัดเรียงกับสิ่งที่เทียบเท่าในอีกภาษาหนึ่ง สำหรับภาษาที่มีทรัพยากรน้อย คลังข้อความขนานดังกล่าวแทบไม่มีอยู่ และแม้แต่เมื่อการแปลได้ผล มันก็ไม่ได้แก้ปัญหาที่ลึกกว่า: ชาวแอฟริกันจำนวนมากโต้ตอบกับเทคโนโลยีผ่านการพูดเป็นหลัก[[OPEN_53]]

[[CLOSE_53]] [[OPEN_54]]

[[CLOSE_54]]"หลายคนในทวีปนี้ไม่รู้จักอ่านและเขียน" Diack กล่าว "เสียงพูดเป็นประตูสู่เทคโนโลยี"[[OPEN_55]]

[[CLOSE_55]] [[OPEN_56]]

[[CLOSE_56]]ลองจินตนาการถึงเกษตรกรในคาดูนาที่ถามเกี่ยวกับการพยากรณ์อากาศเป็นภาษาเฮาซา หรือแม่คนหนึ่งในหมู่บ้านชนบทของกานาที่กำลังมองหาคำแนะนำด้านโภชนาการในภาษาท้องถิ่นของเธอ ระบบที่ใช้ข้อความสันนิษฐานว่ามีการรู้หนังสือและการสะกดคำที่เป็นมาตรฐาน ระบบเสียงต้องนำทางภาษาถิ่น คำสแลง การสลับภาษา และรูปแบบการพูดที่ไม่ทั่วไป[[OPEN_57]]

[[CLOSE_57]] [[OPEN_58]]

[[CLOSE_58]]ในกานา โครงการจดจำเสียงพูด UGSpeechData initiative ผลิตข้อมูลเสียงมากกว่า 5,000 ชั่วโมง ริเริ่มนั้นได้เปิดใช้งานการพัฒนาแชทบอทด้านสุขภาพมารดาที่ทำงานในภาษาท้องถิ่นในภายหลัง นอกจากนี้ยังขยายไปสู่การทำงานเกี่ยวกับการพูดที่ไม่ทั่วไป ช่วยเหลือชุมชนของผู้หูหนวกและผู้รอดชีวิตจากโรคหลอดเลือดสมอง ซึ่งรูปแบบการพูดของพวกเขามักทำให้ระบบ AI หลักสับสน[[OPEN_59]]

[[CLOSE_59]] [[OPEN_60]]

[[CLOSE_60]]"ระบบ AI ไม่ได้ปรับให้เข้ากับสิ่งนั้น" Diack กล่าว "หากคุณมีการพูดประเภทต่าง ๆ มีแนวโน้มว่าระบบจะไม่เข้าใจคุณ"[[OPEN_61]]

[[CLOSE_61]] [[OPEN_62]]

[[CLOSE_62]][[OPEN_63]][[CLOSE_63]]สนามที่แออัด[[OPEN_64]][[CLOSE_64]][[OPEN_65]]

[[CLOSE_65]] [[OPEN_66]]

[[CLOSE_66]]Google ไม่ได้อยู่คนเดียวในการแข่งขันนี้[[OPEN_67]]

[[CLOSE_67]] [[OPEN_68]]

[[CLOSE_68]]Masakhane กลุ่มวิจัยโอเพนซอร์สระดับรากหญ้า ได้สร้างระบบแปลภาษาแอฟริกันมากกว่า 45 ภาษาและพัฒนา Lulu ซึ่งเป็นมาตรฐานสำหรับการประเมินโมเดลภาษาแอฟริกัน ปรัชญาของมันคือชุมชนเป็นอันดับหนึ่งและเปิดอย่างสมบูรณ์[[OPEN_69]]

[[CLOSE_69]] [[OPEN_70]]

[[CLOSE_70]]Lelapa AI ของแอฟริกาใต้ ซึ่งก่อตั้งโดยอดีตนักวิจัยจาก DeepMind มุ่งเน้นผลิตภัณฑ์ Natural Language Processing (NLP) เชิงพาณิชย์สำหรับธุรกิจแอฟริกัน โมเดลหลักคือ Vulavula จับภาษาถิ่นและรูปแบบการสลับรหัสในเมืองในภาษา isiZulu, Sesotho และ Afrikaans Lelapa เน้น "ground truth" datasets และการวิเคราะห์ข้อผิดพลาดของมนุษย์อย่างหนัก ซึ่งเป็นแนวทางที่มีราคาแพงแต่มีความเที่ยงตรงสูง[[OPEN_71]]

[[CLOSE_71]] [[OPEN_72]]

[[CLOSE_72]]Lesan AI ในเอธิโอเปียได้สร้างระบบแปลภาษาที่แม่นยำที่สุดบางระบบสำหรับภาษาอัมฮารา ทิกรินยา และโอโรโม โดยใช้โมเดล human-in-the-loop เพื่อให้แน่ใจว่ามีความละเอียดอ่อนทางวัฒนธรรม[[OPEN_73]]

[[CLOSE_73]] [[OPEN_74]]

[[CLOSE_74]]โครงการ No Language Left Behind (NLLB-200) ของ Meta ใช้แนวทางขนาดใหญ่ แปลภาษามากกว่า 200 ภาษา รวมถึงภาษาแอฟริกัน 55 ภาษา โดยใช้ zero-shot learning ในขณะเดียวกัน Microsoft บูรณาการภาษาแอฟริกันเข้ากับ Microsoft Translator และกำลังลงทุนในชุดข้อมูลการเกษตรแบบหลายรูปแบบผ่านโครงการอย่าง Gecko[[OPEN_75]]

[[CLOSE_75]] [[OPEN_76]]

[[CLOSE_76]]ริเริ่ม African Next Voices ที่ได้รับทุนจาก Gates Foundation เปิดตัวในปลายปี 2025 ผลิตข้อมูลเสียงพูด 9,000 ชั่วโมงใน 18 ภาษา[[OPEN_77]]

[[CLOSE_77]] [[OPEN_78]]

[[CLOSE_78]]ระบบนิเวศมีความหลากหลาย: กลุ่มโอเพนซอร์ส สตาร์ทอัพเชิงพาณิชย์ ยักษ์ใหญ่ด้านเทคโนโลยี ผู้ให้ทุนด้านการกุศล แต่ละคนเข้าหาปัญหาแตกต่างกัน: ขนาดเทียบกับความลึก ข้อความเทียบกับเสียง เปิดเทียบกับเป็นกรรมสิทธิ์[[OPEN_79]]

[[CLOSE_79]] [[OPEN_80]]

[[CLOSE_80]]ความโดดเด่นของ Google อยู่ที่แนวทางที่เน้นเสียงพูดหนักและมุ่งเน้นระบบนิเวศ[[OPEN_81]]

[[CLOSE_81]] [[OPEN_82]]

[[CLOSE_82]][[OPEN_83]][[CLOSE_83]]อธิปไตยเทียบกับการเป็นอัมพาต[[OPEN_84]][[CLOSE_84]][[OPEN_85]]

[[CLOSE_85]] [[OPEN_86]]

[[CLOSE_86]]แต่การมีส่วนร่วมของยักษ์ใหญ่ด้านเทคโนโลยีระดับโลกย่อมก่อให้เกิดคำถามเกี่ยวกับอธิปไตยข้อมูลและการพึ่งพา[[OPEN_87]]

[[CLOSE_87]] [[OPEN_88]]

[[CLOSE_88]]หาก Google ประสานการเผยแพร่ชุดข้อมูลเสียงพูดหลายภาษา นั่นจะสร้างการพึ่งพาโครงสร้างกับผลิตภัณฑ์ของ Google หรือไม่? นักพัฒนาท้องถิ่นอาจกลายเป็นพึ่งพาเครื่องมือที่ฝังอยู่ใน Gemini, Search หรือ Android ได้หรือไม่?[[OPEN_89]]

[[CLOSE_89]] [[OPEN_90]]

[[CLOSE_90]]Diack ยอมรับความตึงเครียดแต่เตือนไม่ให้ขัดแย้งกันจนไม่ทำอะไรเกี่ยวกับโอกาสที่นำเสนอ[[OPEN_91]] [[CLOSE_91]][[OPEN_92]]

[[CLOSE_92]] [[OPEN_93]]

[[CLOSE_93]]"สิ่งที่สำคัญที่สุดคือเราไม่ถูกทิ้งไว้ข้างหลัง" เขากล่าว "ฉันไม่ต้องการให้ข้อมูลของฉันถูกใช้ในทางที่ผิดอย่างแน่นอน แต่นี่เป็นเรื่องเกี่ยวกับการเปิดให้ผู้ประกอบการ สตาร์ทอัพ และนักวิจัยทำงานกับข้อมูลที่สำคัญจริง ๆ"[[OPEN_94]]

[[CLOSE_94]] [[OPEN_95]]

[[CLOSE_95]]เขาเปรียบเทียบกับความร่วมมือระหว่างมหาวิทยาลัยและบริษัทเทคโนโลยีในสหรัฐอเมริกาและยุโรป เขาแย้งว่าความร่วมมือเร่งการสร้างความสามารถ นักวิจัยที่เกี่ยวข้องกับโครงการตั้งแต่เนิ่น ๆ ได้ตีพิมพ์บทความและก้าวไปสู่บทบาทวิจัยระดับโลกแล้ว[[OPEN_96]]

[[CLOSE_96]] [[OPEN_97]]

[[CLOSE_97]]โมเดลใบอนุญาตแบบเปิดเป็นศูนย์กลางของข้อโต้แย้งนั้น นักพัฒนาสามารถสร้างผลิตภัณฑ์เชิงพาณิชย์บนชุดข้อมูล WAXAL โดยไม่ต้องพึ่งพา API ที่เป็นกรรมสิทธิ์ของ Google Google ยังได้เผยแพร่โมเดลแปลภาษา open-weight อย่าง Translate Gemma ซึ่งสามารถดาวน์โหลดและปรับแต่งได้อย่างอิสระ[[OPEN_98]]

[[CLOSE_98]] [[OPEN_99]]

[[CLOSE_99]]ความสมดุลนั้นจะทำให้นักวิจารณ์พอใจหรือไม่ยังคงต้องรอดู แต่ขนาดของช่องว่างภาษาบ่งชี้ว่าการไม่ลงมืออาจมีความเสี่ยงมากกว่า[[OPEN_100]]

[[CLOSE_100]] [[OPEN_101]]

[[CLOSE_101]][[OPEN_102]][[CLOSE_102]]โครงสร้างพื้นฐาน: ข้อกำหนดเบื้องต้นที่เงียบ[[OPEN_103]][[CLOSE_103]][[OPEN_104]]

[[CLOSE_104]] [[OPEN_105]]

[[CLOSE_105]]Voice AI ไม่ได้อยู่โดดเดี่ยว มันต้องการการเชื่อมต่อ แบนด์วิธ และโครงสร้างพื้นฐานการคำนวณ[[OPEN_106]]

[[CLOSE_106]] [[OPEN_107]]

[[CLOSE_107]]"คุณไม่สามารถฝึกโมเดล AI โดยไม่มีโครงสร้างพื้นฐานที่เหมาะสม" Diack กล่าว[[OPEN_108]]

[[CLOSE_108]] [[OPEN_109]]

[[CLOSE_109]]Google ได้ลงทุนในสายเคเบิลใต้น้ำ รวมถึงการวางสาย Equiano ในไนจีเรียและตลาดแอฟริกันอื่น ๆ เพื่อเสริมความยืดหยุ่นของบรอดแบนด์ การตัดสายไฟเบอร์ในช่วงไม่กี่ปีที่ผ่านมาเปิดเผยความเปราะบางของเครือข่ายภูมิภาค โครงสร้างพื้นฐานที่ซ้ำซ้อนและมีความจุสูงเป็นสิ่งจำเป็นไม่เพียงแต่สำหรับบริการคลาวด์เท่านั้น แต่ยังสำหรับศูนย์ข้อมูลท้องถิ่น ซึ่งเป็นเสาหลักสำคัญของอธิปไตยดิจิทัล[[OPEN_110]]

[[CLOSE_110]] [[OPEN_111]]

[[CLOSE_111]]การพัฒนา AI ขึ้นอยู่กับรากฐานสามประการ: คน ข้อมูล และโครงสร้างพื้นฐาน ประชากรที่เป็นเยาวชนของแอฟริกา ซึ่งคาดว่าจะคิดเป็นส่วนแบ่งใหญ่ของผู้ใช้ AI ทั่วโลกในทศวรรษที่จะมาถึง ให้ข้อได้เปรียบด้านประชากร แต่หากไม่มีการลงทุนในขีดความสามารถการวิจัยและโครงสร้างพื้นฐานดิจิทัล ศักยภาพด้านประชากรจะไม่กลายเป็นความเป็นผู้นำทางเทคโนโลยี[[OPEN_112]]

[[CLOSE_112]] [[OPEN_113]]

[[CLOSE_113]][[OPEN_114]][[CLOSE_114]]ความท้าทายในการประสานงาน[[OPEN_115]][[CLOSE_115]][[OPEN_116]]

[[CLOSE_116]] [[OPEN_117]]

[[CLOSE_117]]เพื่อหลีกเลี่ยงการกระจายตัว Google ได้เปลี่ยนจากความร่วมมือกับมหาวิทยาลัยที่แยกกันไปสู่รูปแบบความร่วมมือที่ประสานงานกันมากขึ้น ความพยายามหนึ่งเกี่ยวข้องกับการทำงานร่วมกับศูนย์ภาษาของ Masakhane และเครือข่ายอาสาสมัครอื่น ๆ เพื่อให้นักวิจัยและสตาร์ทอัพสามารถสมัครขอเงินทุนและมีส่วนร่วมในชุดข้อมูลที่ใช้ร่วมกัน[[OPEN_118]]

[[CLOSE_118]] [[OPEN_119]]

[[CLOSE_119]]"หากเราทุกคนทำสิ่งของตัวเองทั่วทั้งทวีป มันไม่ได้ผล" Diack กล่าว "เราต้องการความพยายามร่วมกัน"[[OPEN_120]]

[[CLOSE_120]] [[OPEN_121]]

[[CLOSE_121]]จนถึงตอนนี้ WAXAL ครอบคลุม 27 ภาษา รวมถึงสี่ภาษาของไนจีเรีย บางภาษาที่ครอบคลุมแล้วรวมถึง Acholi, Akan, Dagaare, Dagbani, Dholuo, Ewe, Fante, Fulani (Fula), Hausa, Igbo, Ikposo (Kposo), Kikuyu, Lingala, Luganda, Malagasy, Masaaba, Nyankole, Rukiga, Shona, Soga (Lusoga), Swahili และ Yoruba[[OPEN_122]] [[CLOSE_122]][[OPEN_123]]

[[CLOSE_123]] [[OPEN_124]]

[[CLOSE_124]]ความทะเยอทะยานที่จะจัดการกับภาษาแอฟริกันมากกว่า 2,000 ภาษาทั้งหมดเป็นเรื่องของความมุ่งหวัง อาจเป็นของรุ่นต่อรุ่น[[OPEN_125]]

[[CLOSE_125]] [[OPEN_126]]

[[CLOSE_126]]"นั่นคือความฝันของฉัน" Diack กล่าว[[OPEN_127]]

[[CLOSE_127]] [[OPEN_128]]

[[CLOSE_128]]แต่การจัดลำดับความสำคัญสำคัญ เขาชี้ไปที่การศึกษา เกษตรกรรม และสุขภาพเป็นโดเมนสำคัญที่ voice AI สามารถส่งมอบผลกระทบที่วัดได้ซึ่งสอดคล้องกับเป้าหมายการพัฒนาที่ยั่งยืน[[OPEN_129]]

[[CLOSE_129]] [[OPEN_130]]

[[CLOSE_130]]การพยากรณ์อากาศที่บูรณาการเข้ากับ Google Search ซึ่งปรับปรุงผ่านริเริ่มวิจัยแอฟริกัน แสดงให้เห็นการแพร่กระจายระดับโลกแล้ว โครงการตรวจจับโรคมันสำปะหลังอย่าง PlantVillage Nuru ที่พัฒนาผ่านความร่วมมือระหว่าง Penn State University, International Institute of Tropical Agriculture (IITA) และ Consultative Group on International Agricultural Research (CGIAR) ได้มีอิทธิพลต่อ AI ด้านการเกษตรนอกเหนือจากแอฟริกา แบบอย่างเหล่านี้บ่งชี้ว่าโซลูชันที่สร้างขึ้นสำหรับแอฟริกาสามารถขยายไปทั่วโลกได้[[OPEN_131]]

[[CLOSE_131]] [[OPEN_132]]

[[CLOSE_132]][[OPEN_133]][[CLOSE_133]]ต้นทุนของ AI ที่เน้นพื้นเมือง[[OPEN_134]][[CLOSE_134]][[OPEN_135]]

[[CLOSE_135]] [[OPEN_136]]

[[CLOSE_136]]การรวบรวมข้อมูลเสียงในสภาพแวดล้อมที่มีทรัพยากรน้อยมีค่าใช้จ่ายสูง การบันทึกภาคสนาม การถอดเสียง การตรวจสอบทางภาษาศาสตร์ และการสังเคราะห์เสียงคุณภาพสตูดิโอต้องการเงินทุนที่ยั่งยืน[[OPEN_137]]

[[CLOSE_137]] [[OPEN_138]]

[[CLOSE_138]]การลงทุนของ Google เป็นส่วนหนึ่งของการเปลี่ยนแปลงอุตสาหกรรมที่กว้างขึ้นจากการขูดข้อความที่มีอยู่ไปสู่การลงทุนในข้อมูลเสียงพูดต้นฉบับ โมเดล human-in-the-loop verification ของ Lelapa AI เน้นย้ำถึงต้นทุนของความแม่นยำ ชุดข้อมูล FLORES-200 ของ Meta อาศัยนักแปลมืออาชีพ ริเริ่มเสียงการเกษตรของ Microsoft เกี่ยวข้องกับวิดีโอที่มีคำอธิบายประกอบหลายพัน[[OPEN_139]]

[[CLOSE_139]] [[OPEN_140]]

[[CLOSE_140]]คุณภาพสำคัญ เสียงสังเคราะห์ต้องฟังดูเป็นธรรมชาติ ระบบจดจำต้องจัดการกับการสลับรหัส การพูดในเมืองมักผสมผสานภาษาอังกฤษ ภาษาท้องถิ่น และคำสแลงในประโยคเดียวกัน[[OPEN_141]]

[[CLOSE_141]] [[OPEN_142]]

[[CLOSE_142]]AI แอฟริกันไม่สามารถสร้างได้จากระบบอัตโนมัติเพียงอย่างเดียว จะต้องการความเชี่ยวชาญทางวัฒนธรรมและภาษาศาสตร์[[OPEN_143]]

[[CLOSE_143]] [[OPEN_144]]

[[CLOSE_144]]สำหรับ Diack ความสำเร็จไม่ได้วัดจากการบูรณาการผลิตภัณฑ์เพียงอย่างเดียว[[OPEN_145]]

[[CLOSE_145]] [[OPEN_146]]

[[CLOSE_146]]"ฉันต้องการเห็นสตาร์ทอัพใช้ประโยชน์จากชุดข้อมูลเพื่อให้บริการในภาษาท้องถิ่น" เขากล่าว "ฉันต้องการเห็นนักวิจัยเขียนบทความโดยใช้ภาษาของเรา ไม่ใช่แค่ภาษาอังกฤษเท่านั้น"[[OPEN_147]]

[[CLOSE_147]] [[OPEN_148]]

[[CLOSE_148]]อย่างไรก็ตาม ประตูที่ Google กำลังสร้างต้องนำไปสู่สิ่งที่จับต้องได้ นั่นรวมถึงผลิตภัณฑ์ของ Google; Search, Gemini, ผู้ช่วยเสียง ที่โต้ตอบอย่างคล่องแคล่วในภาษาโยรูบา วูลอฟ เฮาซา หรือลูกันดา แต่ยังรวมถึงสตาร์ทอัพอิสระที่สร้างเครื่องมือฟินเทค แชทบอทด้านสุขภาพ หรือระบบให้คำปรึกษาด้านการเกษตร[[OPEN_149]]

[[CLOSE_149]] [[OPEN_150]]

[[CLOSE_150]]อย่างไรก็ตาม อนาคต AI ของแอฟริกาขึ้นอยู่กับว่าเสียงพูดจะกลายเป็นพลังที่ทำให้เท่าเทียมกันหรือเป็นโอกาสที่พลาดไปอีกหนึ่งครั้ง หากคำพูดยังคงไม่ได้รับการยอมรับจากระบบทั่วโลก คำพูดหลายพันล้านคำที่พูดทุกวันทั่วทั้งทวีปจะยังคงมองไม่เห็นในโลกดิจิทัล[[OPEN_151]]

[[CLOSE_151]]

โอกาสทางการตลาด
native coin โลโก้
ราคา native coin(NATIVE)
$0.00001712
$0.00001712$0.00001712
-0.11%
USD
native coin (NATIVE) กราฟราคาสด
ข้อจำกัดความรับผิดชอบ: บทความที่โพสต์ซ้ำในไซต์นี้มาจากแพลตฟอร์มสาธารณะและมีไว้เพื่อจุดประสงค์ในการให้ข้อมูลเท่านั้น ซึ่งไม่ได้สะท้อนถึงมุมมองของ MEXC แต่อย่างใด ลิขสิทธิ์ทั้งหมดยังคงเป็นของผู้เขียนดั้งเดิม หากคุณเชื่อว่าเนื้อหาใดละเมิดสิทธิของบุคคลที่สาม โปรดติดต่อ service@mexc.com เพื่อลบออก MEXC ไม่รับประกันความถูกต้อง ความสมบูรณ์ หรือความทันเวลาของเนื้อหาใดๆ และไม่รับผิดชอบต่อการดำเนินการใดๆ ที่เกิดขึ้นตามข้อมูลที่ให้มา เนื้อหานี้ไม่ถือเป็นคำแนะนำทางการเงิน กฎหมาย หรือคำแนะนำจากผู้เชี่ยวชาญอื่นๆ และไม่ถือว่าเป็นคำแนะนำหรือการรับรองจาก MEXC

คุณอาจชอบเช่นกัน

น้ำมันดิบ WTI ทรงตัวต่ำกว่า $63.00 ท่ามกลางความกังวลเรื่องอุปทานล้นตลาดที่กดดันตลาด

น้ำมันดิบ WTI ทรงตัวต่ำกว่า $63.00 ท่ามกลางความกังวลเรื่องอุปทานล้นตลาดที่กดดันตลาด

บทความ WTI Crude Oil Stagnates Below $63.00 As Daunting Oversupply Concerns Weigh On Markets ปรากฏบน BitcoinEthereumNews.com. WTI Crude Oil Stagnates Below
แชร์
BitcoinEthereumNews2026/02/13 10:56
ภัยคุกคามที่ซ่อนเร้นต่อแคมเปญโฆษณาฟินเทค: คลิกปลอม

ภัยคุกคามที่ซ่อนเร้นต่อแคมเปญโฆษณาฟินเทค: คลิกปลอม

เพื่อปรับปรุงการเติบโตและประสิทธิภาพ บริษัทฟินเทคลงทุนอย่างหนักในแคมเปญโฆษณาต่างๆ อย่างไรก็ตาม มีภัยคุกคามที่ซ่อนอยู่กำลังกัดกร่อนงบประมาณของพวกเขา นั่นคือการคลิกปลอม Click
แชร์
Blockchainmagazine2026/02/13 10:53
Hyperliquid ประกาศว่าฟังก์ชันการค้ำประกันข้ามบัญชี HIP-3 พร้อมใช้งานบน testnet แล้ว

Hyperliquid ประกาศว่าฟังก์ชันการค้ำประกันข้ามบัญชี HIP-3 พร้อมใช้งานบน testnet แล้ว

PANews รายงานเมื่อวันที่ 13 กุมภาพันธ์ว่า ตามประกาศจาก Hyperliquid ฟังก์ชันการใช้มาร์จินแบบไขว้ของตลาดสัญญาถาวรแบบไร้การอนุญาต HIP-3
แชร์
PANews2026/02/13 11:25