รู้จักกับ Generative AI

ทำความเข้าใจ Generative AI คืออะไร?

Generative AI (GeneAI) หมายถึงการใช้อัลกอริทึม และเทคนิค Machine Learning เพื่อสร้างเนื้อหาที่เลียนแบบหรือคล้ายกับข้อมูลที่มนุษย์สร้างขึ้น ซึ่งแตกต่างจากระบบ AI ดั้งเดิม ที่ยังต้องพึ่งพาการเขียนโปรแกรมที่ชัดเจน เรียกได้ว่ามันเป็น AI ในฉบับที่เฉลียวฉลาดขึ้นนั่นเอง GeneAI ได้รับการฝึกอบรมด้วยข้อมูลจำนวนมหาศาล จากนั้นมันจึงใช้ความรู้นั้นประยุกต์เข้าด้วยกันเพื่อสร้างผลลัพธ์ที่แปลกใหม่ ตัวอย่างของโมเดล GeneAI พื้นฐาน ได้แก่ GPT-3 และ DALL-E ซึ่งช่วยให้ผู้ใช้สามารถใช้ประโยชน์จากพลังของภาษาได้ อาทิ แอปพลิเคชันยอดนิยมอย่าง ChatGPT ที่ช่วยให้ผู้ใช้สร้างข้อความในรูปแบบที่หลากหลายตามคำขอที่เป็นข้อความสั้นๆ ได้ ในทางกลับกัน DALL-E เป็น Machine Learning Model (AI) ที่สามารถเปลี่ยนข้อความที่เราป้อนให้กลายเป็นรูปภาพตามที่เราสั่งได้ ช่วยให้ผู้ใช้สร้างภาพที่เหมือนจริงได้ด้วยการป้อนข้อความนั่นเองครับ

ประวัติความเป็นมาของ Generative AI

GeneAI มีประวัติศาสตร์อันยาวนานที่สามารถย้อนไปถึงสมัยกรีกโบราณได้เลยทีเดียว อย่างไรก็ตาม AI สมัยใหม่นั้นเริ่มต้นขึ้นจริงๆ จังๆ ในทศวรรษที่ 1950 ด้วยการวิจัยของ Alan Turing เกี่ยวกับการคิดด้วยเครื่องจักรและการสร้างการทดสอบที่ชื่อว่า “Turing Test” ซึ่งเป็นโครงข่าย Neural Network (ชิ้นส่วนสำคัญของเทคโนโลยีที่อยู่ภายใต้ AI กำเนิด) ตัวแรก ที่สามารถฝึกฝนได้ซึ่งถูกประดิษฐ์ขึ้นในปี 1957 โดย Frank Rosenblatt นักจิตวิทยาแห่งมหาวิทยาลัย Cornell การพัฒนาอย่างต่อเนื่องของ Neural Network โครงข่ายประสาทเทียมที่จำลองวิธีการทำงานของสมองมนุษย์นี้ ได้นำไปสู่การใช้งาน AI อย่างแพร่หลายตลอดช่วงปี 1980 และหลังจากนั้น ในปี 2014 มีการสร้างอัลกอริทึมประเภทหนึ่งที่เรียกว่า generative adversarial network (GAN) ซึ่งเป็นจุดกำเนิดของ GeneAI ในเวลาต่อมา

ในปี 2023 ความแพร่หลายของแอปพลิเคชัน AI เพื่อการสร้างสรรค์ เช่น ChatGPT เป็นเครื่องบ่งชี้ถึงความนิยมที่เพิ่มขึ้นของ GeneAI รวมถึงการใช้งานที่หลากหลาย แอปพลิเคชั่น AI ที่แพร่หลายในปัจจุบันได้เปลี่ยนวิธีที่ผู้ใช้โต้ตอบกับโลก ตัวอย่างเช่น ขณะนี้ AI ที่สั่งงานด้วยเสียงได้รับการติดตั้งล่วงหน้าในโทรศัพท์ ลำโพง และเทคโนโลยีในชีวิตประจำวันอื่นๆ เป็นต้น ในทำนองเดียวกัน ผู้ใช้สามารถโต้ตอบกับ GeneAI ได้อย่างง่ายดาย ท่ามกลางกระแสต่อต้านการใช้งาน AI โดยเฉพาะในแวดวงของวิชาการและงานศิลปะ แต่ดูเหมือนว่ามันได้กลายเป็นเทคโนโลยีที่เราไม่อาจเลี่ยงได้แล้วในปัจจุบัน

ท่ามกลาง แอปพลิเคชัน AI มากมายในตลาด ผมขอยกตัวอย่างของ GeneAI บางส่วนที่ได้รับความนิยมในปัจจุบันครับ

ChatGPT

ChatGPT สร้างขึ้นโดย OpenAI เป็นตัวอย่างของ AI ที่สามารถสร้างข้อความใหม่จากข้อความที่เป็นคำสั่งจากมนุษย์ โดยพื้นฐานแล้ว Chatbot ที่ขับเคลื่อนด้วย AI เช่น ChatGPT นั้นได้รับการฝึกฝนให้โต้ตอบกับผู้ใช้ผ่านบทสนทนาด้วยภาษาที่เป็นธรรมชาติ ผู้ใช้สามารถถามคำถามทั้งยังมีส่วนร่วมในการสนทนาแบบโต้ตอบ และสามารถสร้างสรรค์ข้อความในรูปแบบต่างๆ ที่หลากหลายได้ เช่น บทกวี บทความ เรียงความ แผนการท่องเที่ยว หรือแม้แต่สูตรอาหาร เป็นต้น ChatGPT เวอร์ชันฟรีเปิดตัวในเดือนพฤศจิกายน 2022 หลังจากการเปิดตัว มันได้สร้างความตื่นตัวให้กับอุตสาหกรรม AI ส่งผลให้มีการแข่งขันกันอย่างหนัก เพราะ OpenAI นั้นได้รับเงินสนับสนุนจาก Microsoft และตอนนี้เสิร์ชเอนจินอย่าง Bing.com ก็เริ่มเอามันเข้ามาใช้เพื่อนำเสนอการค้นหารูปแบบใหม่ (Chat Search) ที่ช่วยให้ผู้ใช้งานทำงานได้อย่างสะดวกและมีประสิทธิภาพมากขึ้น ดังนั้น Google ที่เป็นเจ้าแห่งตลาดเสิร์ชเอนจินจึงไม่สามารถอยู่เฉย ๆ ได้

Bard

หลังจาก ChatGPT เปิดตัวและสร้างความตื่นตัวให้วงการ AI ได้ไม่นาน Google เจ้าแห่งตลาดเสิร์ชเอนจินจึงอยู่เฉยไม่ได้ จึงได้มีการเปิดตัว “Bard” อินเทอร์เฟซ AI ตัวใหม่ ในเดือนมีนาคม ปี 2023 ที่สามารถสร้างข้อความใหม่จากการป้อนข้อความคำสั่งโดยใช้ LaMDA โมเดลภาษาขนาดใหญ่ของ Google (Language Model for Dialogue Applications) และเช่นเดียวกับ ChatGPT Bard เป็นแชทบอทที่ขับเคลื่อนโดยเทคโนโลยี AI ที่สามารถตอบคำถามหรือสร้างข้อความตามคำแนะนำที่ผู้ใช้กำหนด หลังจาก Bard เปิดตัวสู่สาธารณะในสหรัฐอเมริกาและสหราชอาณาจักร ก็มาพร้อมกับข่าวพาดหัวใหญ่ กรณี “Bard แชร์ข้อมูลที่ไม่ถูกต้องในวิดีโอ” จากเหตุการณ์นี้ส่งผลให้หุ้นของบริษัทแม่ Alphabet (GOOG, GOOGL) ร่วงลงประมาณ 9% ถัดจากการประกาศเปิดตัว เรียกได้ว่าความผิดพลาดของ Alphabet ครั้งนี้ได้กลายเป็นกรณีศึกษาครั้งสำคัญก็ว่าได้ ล่าสุด Alphabet มีแผนที่จะขยายบริการไปยังประเทศต่างๆ ในภาษาต่างๆ มากขึ้นในอนาคต

DALL-E

Dall-E อีกหนึ่งแพลตฟอร์มจาก OpenAI ถูกพูดถึงครั้งแรกในเดือนมิถุนายน 2020 แต่เดิมเรียกว่า Image GPT ซึ่งเป็นความพยายามเริ่มต้นในการแสดงให้เห็นว่าโครงข่ายประสาทเทียม (Neural Network) สามารถใช้สร้างภาพคุณภาพสูงใหม่ได้อย่างไร Dall-E สามารถขยายแนวคิดเริ่มต้นของ Image GPT เพื่อให้ผู้ใช้สามารถสร้างรูปภาพใหม่จากข้อความได้ เช่นเดียวกับที่ GPT-3 สามารถสร้างข้อความใหม่เพื่อตอบสนองต่อข้อความที่มนุษย์ป้อนให้ DALL-E เปิดตัวในเดือนมกราคม 2021 มันได้รับการฝึกอบรมเกี่ยวกับรูปภาพจากคำอธิบายประกอบ ผู้ใช้สามารถป้อนข้อความอธิบายหรือกำหนดเงื่อนไข ซึ่ง DALL-E จะสร้างภาพที่เหมือนจริงตามคำแนะนำ นอกจากนี้มันยังสามารถสร้างความแตกต่างให้กับภาพที่สร้างขึ้นในรูปแบบต่างๆ ที่หลากหลายในมุมมองที่แตกต่างกันได้ DALL-E สามารถแก้ไขภาพได้ทั้งการเปลี่ยนแปลงภายในภาพ (Inpainting) หรือขยายภาพให้เกินจากขอบเขตเดิมได้ (Outpainting)

Stable Diffusion

Stable Diffusion โดย Stability AI เปิดตัวในเดือนสิงหาคม ปี 2022 เป็นอีกหนึ่งตัวอย่างของ AI ที่สามารถสร้างสรรค์ภาพจากข้อความที่ผู้ใช้ป้อนคำสั่งหรือกำหนดเงื่อนไข ตัวอย่างเช่น ผู้ใช่ใส่คำว่า “apple” ระบบก็จะสร้างภาพแอปเปิ้ลให้ นอกจากนี้ ยังสามารถเข้าใจคำสั่งที่ซับซ้อนมากขึ้น เช่น การสร้างภาพแอปเปิ้ลในรูปแบบศิลปะเฉพาะ เป็นต้น Stable Diffusion ได้รับการฝึกอบรมเกี่ยวกับรูปภาพจำนวนมากจากอินเทอร์เน็ต ซึ่งส่วนใหญ่มาจากเว็บไซต์รูปภาพอย่าง Pinterest, DeviantArt และ Flickr มันสร้างภาพที่เหมือนจริงที่ยากต่อการแยกแยะจากของจริงและภาพที่แยกแยะได้ยากนอกเหนือจากงานศิลปะที่วาดด้วยมือ นอกจากนี้มันยังสามารถแปลงภาพที่เห็นได้ชัดว่าเป็นของปลอมได้ นอกจากการสร้างรูปภาพแล้ว Stable Diffusion ยังสามารถเพิ่มหรือแทนที่องค์ประกอบภายในภาพ และขยายรูปภาพให้ใหญ่ขึ้น ที่สำคัญมันสามารถเปลี่ยนแปลงภาพใดๆ ก็ได้ ไม่ว่าภาพต้นฉบับจะถูกสร้างด้วย AI หรือไม่ก็ตาม Stable Diffusion เป็นโอเพ่นซอร์ส ดังนั้นใคร ๆ ก็สามารถใช้งานได้