วันศุกร์ที่ 11 กรกฎาคม พ.ศ. 2568

 

บทความ: โปรแกรมถอดเสียงจากวิดีโอเป็นตัวหนังสือฟรี พร้อมไทม์ไลน์: ทางเลือกออนไลน์และออฟไลน์

การแปลงเสียงพูดในวิดีโอให้เป็นข้อความเป็นสิ่งจำเป็นในหลายบริบท ไม่ว่าจะเป็นการสร้างคำบรรยาย (Subtitles), การทำบันทึกการประชุม, การถอดเทปสัมภาษณ์, หรือการสรุปบทเรียนจากวิดีโอ การมีไทม์ไลน์ของข้อความเป็นสิ่งสำคัญเพื่อให้สามารถอ้างอิงช่วงเวลาการพูดได้อย่างแม่นยำ บทความนี้จะนำเสนอโปรแกรมและวิธีการถอดเสียงจากวิดีโอที่สามารถใช้งานได้ฟรี ทั้งในรูปแบบออนไลน์และออฟไลน์ พร้อมคำแนะนำในการใช้งานและข้อจำกัด


ส่วนที่ 1: โปรแกรม/บริการถอดเสียงจากวิดีโอพร้อมไทม์ไลน์ (ออนไลน์ ฟรี/มีข้อจำกัดฟรี)

โปรแกรมเหล่านี้เป็นที่นิยมและใช้งานง่าย เหมาะสำหรับผู้ที่สามารถเชื่อมต่ออินเทอร์เน็ตได้ และต้องการความสะดวกสบายในการใช้งานโดยไม่ต้องติดตั้งโปรแกรมซับซ้อน

  1. CapCut

    • มันคืออะไร: โปรแกรมตัดต่อวิดีโอที่มีฟังก์ชัน AI ในการถอดเสียงเป็นข้อความและสร้างคำบรรยายอัตโนมัติ ใช้งานง่ายและได้รับความนิยมอย่างมาก

    • สำหรับใคร: ผู้สร้างเนื้อหา (Content Creator), นักเรียน, นักวิจัย, หรือบุคคลทั่วไป

    • จะใช้งานได้อย่างไร: อัปโหลดวิดีโอของคุณไปยัง CapCut (มีทั้งเวอร์ชันบนเว็บและแอปมือถือ) จากนั้นเลือกฟังก์ชัน "สร้างคำบรรยายอัตโนมัติ" (Auto-subtitle) หรือ "ถอดเสียง" (Transcribe) โปรแกรมจะสร้างข้อความพร้อมไทม์ไลน์

    • ข้อจำกัดของระบบ: สามารถใช้งานได้บนอุปกรณ์ Windows, Mac, Android, iPhone และ Web Browser

    • มีค่าบริการหรือไม่: มีฟังก์ชันฟรีให้ใช้งาน และมีคุณสมบัติเพิ่มเติมที่ต้องสมัครสมาชิก (Premium)

    • ลิงก์ที่เกี่ยวข้อง: CapCut Website

  2. Transkriptor

    • มันคืออะไร: เครื่องมือถอดเสียงที่ขับเคลื่อนด้วย AI สามารถแปลงเสียงและวิดีโอเป็นข้อความได้อย่างแม่นยำสูง พร้อมการประทับเวลา

    • สำหรับใคร: นักเรียน, นักวิจัย, ผู้ที่ต้องถอดเสียงการประชุม, การสัมภาษณ์ หรือพอดแคสต์

    • จะใช้งานได้อย่างไร: อัปโหลดไฟล์วิดีโอของคุณไปยัง Transkriptor (ผ่านเว็บแอปพลิเคชันหรือแอปมือถือ) ระบบจะใช้ AI ในการถอดเสียง ระบุผู้พูด และสร้างข้อความพร้อมการประทับเวลา

    • ข้อจำกัดของระบบ: รองรับการถอดเสียงมากกว่า 100 ภาษา มีการประทับเวลาและระบุผู้พูด

    • มีค่าบริการหรือไม่: สามารถใช้งานฟรีสำหรับการถอดเสียงหรือวิดีโอที่มีความยาวไม่เกิน 5 นาที หากต้องการใช้งานเต็มรูปแบบจะต้องสมัครสมาชิก

    • ลิงก์ที่เกี่ยวข้อง: Transkriptor Website

  3. NoteGPT (เน้น YouTube)

    • มันคืออะไร: เครื่องมือออนไลน์ฟรีที่ช่วยแปลงวิดีโอ YouTube เป็นข้อความพร้อมการประทับเวลา และยังสามารถสรุปเนื้อหาได้ด้วย AI

    • สำหรับใคร: นักเรียน, นักวิจัย, ผู้สร้างเนื้อหา (YouTube Creator), หรือผู้ที่ต้องการสรุปและถอดเสียงวิดีโอจาก YouTube

    • จะใช้งานได้อย่างไร: คัดลอกลิงก์วิดีโอ YouTube มาวางใน NoteGPT แล้วกด "Generate" ระบบจะแปลงวิดีโอเป็นข้อความพร้อมการประทับเวลา

    • ข้อจำกัดของระบบ: เน้นการทำงานกับวิดีโอ YouTube เป็นหลัก ให้ความแม่นยำสูง

    • มีค่าบริการหรือไม่: มีเวอร์ชันฟรีให้ใช้งาน

    • ลิงก์ที่เกี่ยวข้อง: NoteGPT Website

  4. Any2Text

    • มันคืออะไร: ซอฟต์แวร์แปลงเสียงและวิดีโอเป็นข้อความออนไลน์ที่ไม่ต้องลงทะเบียน

    • สำหรับใคร: บุคคลทั่วไปที่ต้องการถอดเสียงไฟล์วิดีโอหรือเสียงอย่างรวดเร็ว

    • จะใช้งานได้อย่างไร: อัปโหลดไฟล์วิดีโอ (รองรับ MP4, MKV, FLV, AVI, MOV, WMV) หรือเสียงของคุณ จากนั้นคลิก "Transcribe" เมื่อถอดเสียงเสร็จสิ้น สามารถดาวน์โหลดเป็นไฟล์ DOCX, XLSX, SRT หรือ TXT ได้

    • มีค่าบริการหรือไม่: มีการทดลองใช้ฟรี และอาจมีค่าบริการสำหรับปริมาณการใช้งานที่มากขึ้น

    • ลิงก์ที่เกี่ยวข้อง: Any2Text Website


ส่วนที่ 2: โปรแกรมถอดเสียงแบบออฟไลน์ (ติดตั้งบนเครื่อง)

การถอดเสียงแบบออฟไลน์โดยใช้ AI ที่แม่นยำและฟรีทั้งหมดนั้นค่อนข้างจำกัด แต่มีทางเลือกที่สามารถทำได้ หากยินดีที่จะประนีประนอมในบางประเด็น

  1. VLC Media Player + oTranscribe (ถอดเสียงด้วยตนเองแบบออฟไลน์)

    • มันคืออะไร: VLC เป็นโปรแกรมเล่นมีเดียยอดนิยม ส่วน oTranscribe เป็นเว็บแอปพลิเคชันที่ออกแบบมาเพื่อช่วยในการถอดเสียงแบบแมนวล

    • สำหรับใคร: ผู้ที่ต้องการควบคุมกระบวนการถอดเสียงด้วยตนเอง, เน้นความเป็นส่วนตัวของข้อมูล, และต้องการทำงานแบบออฟไลน์โดยไม่มีข้อจำกัดด้านเวลา

    • จะใช้งานได้อย่างไร:

      • ติดตั้ง VLC Media Player: ดาวน์โหลดและติดตั้ง VLC บนคอมพิวเตอร์ของคุณ

      • การใช้งาน oTranscribe แบบออฟไลน์ (สำคัญมาก):

        1. เข้าถึง oTranscribe ออนไลน์ครั้งแรก: เปิดเว็บเบราว์เซอร์ของคุณ (Chrome, Firefox, Edge) และเข้าสู่เว็บไซต์ของ oTranscribe: oTranscribe Website

        2. รอให้โหลดหน้าเว็บจนเสร็จ: เมื่อหน้าเว็บโหลดเสร็จสมบูรณ์ เบราว์เซอร์จะเก็บข้อมูลของหน้าเว็บและไฟล์ JavaScript ที่จำเป็นไว้ในแคช (Cache) ของเครื่องคุณ

        3. ตัดการเชื่อมต่ออินเทอร์เน็ต: ตอนนี้คุณสามารถปิด Wi-Fi หรือถอดสาย LAN ออกจากคอมพิวเตอร์ได้เลย

        4. เปิด oTranscribe อีกครั้ง (แบบออฟไลน์): พิมพ์ otranscribe.com ในแถบที่อยู่ของเบราว์เซอร์อีกครั้ง หรือเปิดจากบุ๊กมาร์กที่คุณบันทึกไว้ เบราว์เซอร์จะโหลดหน้า oTranscribe จากแคชบนเครื่องของคุณ ทำให้สามารถใช้งานได้แม้ไม่มีอินเทอร์เน็ต

        5. อัปโหลดไฟล์วิดีโอ/เสียงใน oTranscribe: คลิกที่ปุ่ม "Choose audio or video file" (รูปไอคอนไฟล์) เพื่อเลือกไฟล์วิดีโอของคุณ (VLC และ oTranscribe ทำงานแยกกัน แต่คุณจะใช้ oTranscribe เป็นเครื่องมือพิมพ์และประทับเวลา)

        6. เริ่มถอดเสียง: เล่นวิดีโอใน VLC (หรือใน oTranscribe ถ้าไฟล์ไม่ใหญ่มาก) แล้วพิมพ์ข้อความลงในช่องของ oTranscribe ใช้คีย์ลัดที่ oTranscribe กำหนด (เช่น Esc เพื่อ Play/Pause, F1 เพื่อ Rewind, F2 เพื่อ Fast-forward) เพื่อควบคุมการเล่นวิดีโอให้ตรงกับการพิมพ์ของคุณ oTranscribe จะช่วยประทับเวลาให้โดยอัตโนมัติเมื่อคุณกด Pause

        7. บันทึกงาน: ข้อความจะถูกบันทึกอัตโนมัติในเบราว์เซอร์ของคุณทุกวินาที เมื่อเสร็จสิ้น คุณสามารถ Export งานออกมาเป็นไฟล์ข้อความ (Plain Text) หรือไฟล์ SubRip (SRT) ที่มีไทม์ไลน์ได้

    • ข้อจำกัด: ไม่ใช่การถอดเสียงอัตโนมัติ ต้องพิมพ์ด้วยตนเอง แต่เป็นวิธีฟรีและทำงานออฟไลน์ได้จริงโดยไม่มีข้อจำกัดด้านเวลา และไฟล์ข้อมูลของคุณจะอยู่บนเครื่องเท่านั้น (เน้นความเป็นส่วนตัว)

    • มีค่าบริการหรือไม่: ฟรีและเป็น Open Source

  2. การใช้ AI Transcription Models (สำหรับผู้มีทักษะทางเทคนิค)

    • มันคืออะไร: การดาวน์โหลดโมเดลปัญญาประดิษฐ์สำหรับการถอดเสียง เช่น Whisper ของ OpenAI มาติดตั้งและรันบนเครื่องของคุณเอง

    • สำหรับใคร: ผู้ที่มีความรู้ด้านคอมพิวเตอร์และเขียนโปรแกรมได้ (เช่น Python) หรือยินดีที่จะเรียนรู้การติดตั้งและใช้งาน

    • จะใช้งานได้อย่างไร:

      • ติดตั้ง Python: ดาวน์โหลด Python เวอร์ชันล่าสุด

      • ติดตั้งไลบรารี Whisper: เปิด Command Prompt (Windows) หรือ Terminal (Mac/Linux) แล้วพิมพ์คำสั่ง:

        Bash
        pip install transformers torch openai-whisper
        

        (อาจต้องติดตั้ง ffmpeg เพิ่มเติมสำหรับการประมวลผลไฟล์มีเดีย: FFmpeg Website)

      • ดาวน์โหลดโมเดล Whisper: โมเดลจะถูกดาวน์โหลดโดยอัตโนมัติเมื่อคุณรันโค้ด Python ครั้งแรก (ต้องมีอินเทอร์เน็ตในการดาวน์โหลดครั้งแรกเท่านั้น) เลือกขนาดโมเดลที่ต้องการ เช่น "base", "medium", "large" (ขนาดใหญ่แม่นยำกว่า แต่ใช้ทรัพยากรเครื่องมากกว่า)

      • เขียนและรันโค้ด Python:

        โค้ด Python:

        
        import whisper
        
        # โหลดโมเดล (การโหลดครั้งแรกต้องใช้อินเทอร์เน็ต)
        # ตัวอย่าง: "base", "medium", "large"
        model = whisper.load_model("base") 
        
        # ระบุ path ของไฟล์วิดีโอ/เสียงของคุณ
        video_path = "C:/Users/YourUser/Videos/my_lecture.mp4" # แก้ไข Path ตามไฟล์ของคุณ
        
        # ทำการถอดเสียง (อาจใช้เวลานานขึ้นอยู่กับความยาวไฟล์และสเปกคอมพิวเตอร์)
        print("กำลังถอดเสียง... โปรดรอสักครู่")
        result = model.transcribe(video_path, word_timestamps=True) # word_timestamps=True เพื่อให้ได้ไทม์ไลน์
        
        # แสดงผลลัพธ์พร้อมไทม์ไลน์
        print("\nข้อความที่ถอดพร้อมไทม์ไลน์:")
        for segment in result["segments"]:
            start_time = segment["start"]
            end_time = segment["end"]
            text = segment["text"]
            print(f"[{start_time:.2f}-{end_time:.2f}] {text}")
        
        # ตัวอย่างการบันทึกเป็นไฟล์ SRT (คำบรรยาย)
        # ต้องติดตั้งไลบรารี srt: pip install srt
        try:
            import srt
            subs = []
            for segment in result["segments"]:
                subs.append(srt.Subtitle(index=len(subs)+1, 
                                        start=srt.timedelta(seconds=segment['start']), 
                                        end=srt.timedelta(seconds=segment['end']), 
                                        content=segment['text'].strip()))
            
            output_srt_path = video_path.replace(".mp4", ".srt").replace(".mov", ".srt") # เปลี่ยนนามสกุลไฟล์
            with open(output_srt_path, "w", encoding="utf-8") as f:
                f.write(srt.compose(subs))
            print(f"\nบันทึกไฟล์ SRT ที่: {output_srt_path}")
        except ImportError:
            print("\nไม่สามารถบันทึกเป็นไฟล์ SRT ได้: ติดตั้ง 'srt' library ก่อน (pip install srt)")
            

        อธิบายโค้ด:

        • import whisper: นำเข้าไลบรารี Whisper

        • model = whisper.load_model("base"): โหลดโมเดล AI "base" (ขนาดเล็กแต่ใช้งานได้ดี) เพื่อใช้ในการถอดเสียง การโหลดครั้งแรกจะดาวน์โหลดโมเดลมาเก็บไว้ในเครื่องคุณ และหลังจากนั้นสามารถใช้งานแบบออฟไลน์ได้

        • video_path = "...": เปลี่ยน Path นี้เป็นที่อยู่ของไฟล์วิดีโอของคุณ

        • model.transcribe(video_path, word_timestamps=True): คำสั่งนี้จะเรียกใช้โมเดล Whisper เพื่อถอดเสียงจากไฟล์วิดีโอที่ระบุ โดย word_timestamps=True จะสั่งให้โมเดลสร้างข้อมูลช่วงเวลาของแต่ละคำหรือประโยคที่ถอดออกมา

        • ส่วนของ for segment in result["segments"]: จะวนลูปเพื่อแสดงผลลัพธ์การถอดเสียง ซึ่งจะแบ่งเป็นช่วงเวลา พร้อมเวลาเริ่มต้นและสิ้นสุดของแต่ละข้อความ

        • ส่วนท้ายเป็นโค้ดเพิ่มเติมสำหรับการบันทึกผลลัพธ์เป็นไฟล์ SRT ซึ่งเป็นรูปแบบไฟล์คำบรรยายมาตรฐาน (ถ้าต้องการใช้ ต้องติดตั้งไลบรารี srt เพิ่มเติม)

    • ข้อจำกัด:

      • ต้องใช้ทักษะทางเทคนิค: ไม่ใช่โปรแกรมสำเร็จรูปทั่วไป ต้องมีการติดตั้งและตั้งค่าด้วยตนเอง

      • ใช้ทรัพยากรเครื่องสูง: โดยเฉพาะโมเดลขนาดใหญ่ อาจต้องใช้ GPU เพื่อการประมวลผลที่รวดเร็ว หากใช้ CPU อาจใช้เวลานานมากสำหรับไฟล์ยาวๆ (เช่น วิดีโอ 30 นาทีขึ้นไป)

      • การดาวน์โหลดโมเดลครั้งแรกต้องออนไลน์: แต่หลังจากนั้นสามารถรันแบบออฟไลน์ได้


สรุปและคำแนะนำเพิ่มเติม:

หากคุณต้องการ "ฟรี + ติดตั้งบนเครื่อง + ออฟไลน์ + ไม่จำกัดเวลา" ตัวเลือกที่ตรงที่สุดคือการ ใช้ VLC Media Player คู่กับ oTranscribe และถอดเสียงด้วยตนเอง ซึ่งให้ความเป็นส่วนตัวสูงสุดและไม่มีข้อจำกัดด้านเวลา แต่ต้องใช้แรงงานคนในการพิมพ์

สำหรับผู้ที่พร้อมจะลงทุนด้านเวลาและความรู้ทางเทคนิคเล็กน้อย Whisper ของ OpenAI เป็นโซลูชัน AI ถอดเสียงแบบออฟไลน์ที่ฟรีและมีคุณภาพสูงมาก แต่ต้องใช้ทรัพยากรเครื่องพอสมควรและมีการตั้งค่าเริ่มต้นที่ต้องทำผ่านโค้ด

หวังว่าบทความนี้จะเป็นประโยชน์และช่วยให้คุณสามารถถอดเสียงจากวิดีโอได้อย่างที่ต้องการนะครับ!

***********************************************************************************
ปัญหาโค้ดยาวทะลุจอ เนื่องจากธีมที่ใช้อยู่ ไม่ได้ปรับแต่ง Code Container ใว้
ทำให้ไม่สามารถสร้างกรอป ครอบโค้ดได้ แล้วโค้ดที่นำมาจาก Gemini จะมี Syntax Highlighting อยู่ด้วย
การที่จะให้แสดงผลได้เช่นเดียวกัน ผมจำต้องปรับปรุงบล็อกนี้หลายอย่าง เนื่องจากไม่ชำนาน และอาจต้องแก้ไขรูปแบบบทความทั้งหมด จึงขอแสดงผมในรูปแบบนี้ ซึ่งสะดวกต่อผมเองมากกว่าครับแล้วมันก็ยังแสดงผลได้ครบถ้วนเช่นเดิม


ปลดล็อกศักยภาพงานวิจัยและจัดการข้อมูลส่วนตัวด้วย NotebookLM (เวอร์ชันฟรี)

ในยุคที่ข้อมูลท่วมท้น การค้นคว้าและจัดการเอกสารจำนวนมากกลายเป็นความท้าทายอย่างยิ่งสำหรับนักเรียน นักศึกษา นักวิจัย หรือแม้แต่มืออาชีพ วันนี้เราจะมาทำความรู้จักกับ NotebookLM เครื่องมือผู้ช่วยด้านการวิจัยและจดบันทึกจาก Google Labs ที่ขับเคลื่อนด้วย AI ซึ่งจะช่วยให้คุณทำงานกับข้อมูลของคุณได้อย่างมีประสิทธิภาพมากขึ้น โดยเฉพาะใน เวอร์ชันฟรี ที่มีฟังก์ชันการทำงานที่น่าทึ่ง

NotebookLM แตกต่างจาก AI ทั่วไปอย่างไร? แล้วมันเหมาะกับใคร? มาดูคำตอบในรูปแบบถาม-ตอบ เพื่อให้คุณเห็นภาพการใช้งานจริงกันครับ!

Q1: NotebookLM แตกต่างจาก AI ทั่วไปอย่างไร? มันสามารถใช้กับข้อมูลส่วนตัวได้จริงหรือ?

A: คุณอาจจะคุ้นเคยกับการใช้ AI อย่าง Gemini หรือ ChatGPT ในการหาข้อมูลทั่วไป เช่น "บทสรุปเกม Final Fantasy VII" ซึ่ง AI เหล่านั้นสามารถให้คำตอบได้อย่างรวดเร็วเพราะข้อมูลมีอยู่บนอินเทอร์เน็ตมากมาย แต่ถ้าคุณมีเอกสารลับของบริษัท รายงานวิจัยส่วนตัว หรือสรุปการประชุมที่ไม่เคยเผยแพร่ที่ไหนล่ะ? AI ทั่วไปจะเข้าถึงข้อมูลเหล่านั้นไม่ได้

นี่คือจุดเด่นของ NotebookLM ครับ: มันถูกออกแบบมาเพื่อทำงานกับ "ข้อมูลส่วนตัวของคุณ" โดยเฉพาะ ข้อมูลที่คุณอัปโหลดเข้าไปจะถูกเก็บเป็นส่วนตัวและจะไม่นำไปใช้ในการฝึกฝนโมเดล AI ทั่วไปของ Google

  • ตัวอย่างจากคำถามของเรา: "ผมอัปโหลดบทสรุปเกม FF7 ไป 3 เล่ม ที่อาจมีคำแนะนำหรือลำดับการเล่นต่างกัน เมื่อผมมีปัญหาหาทางไปไม่เจอ ผมก็พิมพ์ถาม ก็จะได้คำตอบจากหนังสือทั้งสามเล่มสรุปเส้นทางออกมา"

    • คำตอบสำหรับ NotebookLM: ในสถานการณ์นี้ NotebookLM จะไม่เพียงแค่ให้คำตอบ แต่จะ "อ้างอิง" กลับไปยังแหล่งข้อมูลต้นฉบับที่คุณป้อนเข้าไปได้อย่างแม่นยำ เช่น "ดูได้จากหนังสือเล่มที่ 1 หน้า 25 และเล่มที่ 3" นี่คือสิ่งที่ AI ทั่วไปทำไม่ได้ เพราะมันไม่มีแหล่งที่มาที่เจาะจงเหมือนคุณกำลังมีผู้ช่วยวิจัยที่อ่านเอกสารของคุณทั้งหมดจริงๆ

  • การใช้งานจริง: ประโยชน์ที่แท้จริงของ NotebookLM จึงเหมาะอย่างยิ่งกับ:

    • เอกสารมหาวิทยาลัย: วิทยานิพนธ์, งานวิจัย, บทความเฉพาะทาง

    • เอกสารบริษัท: รายงานการประชุม, แผนงานโครงการ, ข้อมูลลูกค้าที่ไม่เปิดเผย

    • บันทึกส่วนตัว: สรุปการบรรยาย, ไอเดียที่รวบรวมมา

Q2: ข้อจำกัดของ NotebookLM เวอร์ชันฟรีมีอะไรบ้าง?

A: แม้จะเป็นบริการฟรี แต่ NotebookLM เวอร์ชันพื้นฐานก็มอบความสามารถที่น่าประทับใจ ด้วยข้อจำกัดที่เหมาะสมสำหรับการใช้งานทั่วไป:

  • จำนวนโน้ตบุ๊ก (Notebooks): สูงสุด 100 โน้ตบุ๊ก (คุณสามารถสร้างสมุดงานแยกกันได้ถึง 100 เล่ม)

  • แหล่งข้อมูลต่อโน้ตบุ๊ก (Sources per Notebook): สูงสุด 50 แหล่งข้อมูลต่อหนึ่งโน้ตบุ๊ก

  • ขนาดแหล่งข้อมูล: แต่ละแหล่งข้อมูลมีข้อจำกัดสูงสุดที่ 500,000 คำ หรือขนาดไฟล์ไม่เกิน 200MB (สำหรับการอัปโหลดไฟล์จากเครื่องคอมพิวเตอร์)

  • การถาม-ตอบ (Chat Queries Daily Limit): สามารถถามคำถามหรือโต้ตอบกับ AI ได้สูงสุด 50 ครั้งต่อวัน

  • การสร้างสรุปเสียง (Audio Generations Daily Limit): สร้างสรุปเนื้อหาในรูปแบบเสียงได้สูงสุด 3 ครั้งต่อวัน

Q3: การสร้างสรุปเสียง (Audio Overviews) ทำอะไรได้บ้าง? มีข้อจำกัดหรือความสามารถพิเศษไหม?

A: ฟีเจอร์ Audio Overviews เป็นอีกหนึ่งความสามารถที่ยอดเยี่ยม ช่วยให้คุณแปลงบันทึกหรือสรุปข้อมูลเป็นไฟล์เสียงคล้ายพอดแคสต์เพื่อฟังได้ทุกที่ทุกเวลา

  • ความยาวของบทสรุปเสียง: ไม่ได้จำกัดความยาวโดยตรงเป็นนาที แต่จะอิงตามความยาวของบันทึกหรือข้อมูลที่คุณเลือกให้สรุป หากข้อมูลยาว บทสรุปเสียงก็จะยาวตามไปด้วย

  • การเลือกสำเนียงหรือภาษาที่ออกเสียง: ปัจจุบัน NotebookLM จะใช้เสียงและภาษาเริ่มต้นตามที่ระบบตรวจจับได้จากเนื้อหาหรือการตั้งค่า UI ยังไม่มีตัวเลือกให้เลือกสำเนียงหรือภาษาที่ออกเสียงโดยตรง

  • สรุปเป็นภาษาต่างประเทศ: ทำได้ครับ! คุณสามารถขอให้ NotebookLM สรุปเนื้อหาจากเอกสารภาษาไทย เป็นภาษาอื่นได้โดยตรง (เช่น ภาษาอังกฤษหรือญี่ปุ่น) โดยไม่ต้องแปลเอกสารต้นฉบับก่อน จากนั้นจึงค่อยใช้ฟังก์ชัน Audio Overviews กับเนื้อหาสรุปที่เป็นภาษาต่างประเทศนั้น คุณก็จะได้ไฟล์เสียงในภาษาที่คุณต้องการ

  • บันทึกหรือรับไฟล์เสียง: ได้ครับ! หลังจากสร้าง Audio Overview แล้ว คุณจะสามารถ ดาวน์โหลดไฟล์เสียง (.mp3) เก็บไว้ใช้งานได้ทันที

Q4: สามารถอัปโหลดข้อมูลจากเว็บไซต์นอกเหนือจาก YouTube ได้หรือไม่?

A: ได้ครับ! NotebookLM รองรับการนำเข้าข้อมูลจาก URL ได้หลากหลายรูปแบบ:

  • เว็บไซต์บทความทั่วไป: คุณสามารถวาง URL ของบทความจากเว็บไซต์ข่าว, บล็อก, วารสารออนไลน์, หรือเว็บไซต์พิพิธภัณฑ์ ได้โดยตรง

  • YouTube Videos: รองรับการดึงเนื้อหาจากวิดีโอ YouTube ที่มีคำบรรยาย (captions)

  • ไฟล์เอกสาร: PDF, Google Docs, Google Slides

  • ไฟล์เสียง: คุณสามารถอัปโหลดไฟล์เสียงได้โดยตรง (NotebookLM จะพยายามถอดเสียงเป็นข้อความให้)

  • ไฟล์ข้อความ: .txt

Q5: ผมสามารถอัปโหลดหนังสือ 20 เล่มในภาษาที่แตกต่างกัน แล้วขอให้สร้างเป็นหนังสือที่สรุปเนื้อหาเป็นภาษาไทยในเล่มเดียวได้ไหม?

A: ได้ครับ! นี่คือหนึ่งในความสามารถที่ทรงพลังของ NotebookLM

  • คุณสามารถอัปโหลดหนังสือได้สูงสุด 50 เล่มในหนึ่งโน้ตบุ๊ก ซึ่งเพียงพอสำหรับ 20 เล่มที่คุณกล่าวมา

  • NotebookLM ใช้โมเดล Gemini ที่มีความสามารถในการเข้าใจและประมวลผลข้อมูลในหลายภาษา

  • คุณสามารถพิมพ์คำสั่ง เช่น "สรุปเนื้อหาสำคัญทั้งหมดจากหนังสือทั้ง 20 เล่มนี้ โดยเน้นไปที่ [หัวข้อที่ระบุ] และเขียนสรุปทั้งหมดเป็นภาษาไทย"

  • ผลลัพธ์: NotebookLM จะประมวลผลเนื้อหาจากแหล่งข้อมูลทั้งหมด สรุปข้อมูล และแปลผลลัพธ์เป็นข้อความภาษาไทยขนาดยาว ซึ่งคุณสามารถคัดลอกและนำไปจัดเรียงเป็นเอกสารของคุณเองได้ (แต่จะไม่ใช่การส่งออกเป็นไฟล์หนังสือสำเร็จรูป เช่น .epub หรือ .pdf)

Q6: แล้วถ้าผมต้องการสร้างบทเรียน โดยใช้ข้อมูลจากหนังสือที่อัปโหลดไปเป็นข้อมูลการสอนล่ะ?

A: ได้ครับ! นี่ก็เป็นอีกหนึ่งการใช้งานที่ยอดเยี่ยมสำหรับ NotebookLM ที่ช่วยในการสร้างสื่อการสอนหรือการเรียนรู้ด้วยตนเอง คุณสามารถใช้คำสั่งได้หลากหลายรูปแบบ เช่น:

  • "สร้างบทเรียนเกี่ยวกับ [หัวข้อ] โดยอ้างอิงจากหนังสือทั้ง 20 เล่มนี้ ให้แบ่งออกเป็นบทเรียนย่อย 5 บท"

  • "สร้างคำถามปลายเปิด 10 ข้อสำหรับนักเรียน เพื่อใช้ทบทวนเนื้อหาจากบทที่ 1 ถึง 5"

  • "สรุปแนวคิดหลักของหนังสือเหล่านี้ในรูปแบบของแผนผังความคิดเพื่อช่วยให้เข้าใจความเชื่อมโยงของข้อมูล"

บทสรุปความสามารถของ NotebookLM (เวอร์ชันฟรี)

NotebookLM เวอร์ชันฟรีนั้นเป็นเครื่องมือที่ทรงพลังอย่างยิ่งสำหรับใครก็ตามที่ต้องจัดการกับข้อมูลจำนวนมาก ไม่ว่าจะเป็นเอกสารวิชาการ รายงานการวิจัย หรือบันทึกส่วนตัว ด้วยความสามารถในการประมวลผลเอกสารหลากหลายประเภท การตอบคำถามโดยอ้างอิงแหล่งที่มา การสรุปเนื้อหา แม้กระทั่งการสร้างบทสรุปเสียง หรือการสังเคราะห์ข้อมูลข้ามภาษา ทำให้ NotebookLM เป็นผู้ช่วย AI ส่วนตัวที่ยอดเยี่ยมในการจัดการและทำความเข้าใจข้อมูลของคุณ


หากเป็นบริการเสียเงิน (NotebookLM Plus) จะมีอะไรเพิ่มเติม?

สำหรับผู้ใช้งานที่ต้องการขีดความสามารถที่สูงขึ้น หรือเป็นส่วนหนึ่งขององค์กรที่ใช้ Google Workspace บางแพ็กเกจ Google ได้นำเสนอ NotebookLM Plus ซึ่งเป็นบริการพรีเมียมที่มาพร้อมกับแพ็กเกจ Google One AI Premium

ข้อดีเพิ่มเติมของ NotebookLM Plus:

  • ขีดจำกัดการใช้งานที่สูงขึ้น 5 เท่า:

    • จำนวนโน้ตบุ๊ก

    • จำนวนแหล่งข้อมูลต่อโน้ตบุ๊ก

    • จำนวนคำต่อแหล่งข้อมูล

    • จำนวนการถาม-ตอบ (chat queries) ต่อวัน

    • จำนวนการสร้างสรุปเสียง (audio generations) ต่อวัน

    • ซึ่งหมายความว่าคุณจะสามารถทำงานกับโครงการที่ใหญ่ขึ้น มีเอกสารจำนวนมาก หรือใช้งานได้เข้มข้นขึ้นในแต่ละวัน

  • คุณสมบัติพรีเมียมเพิ่มเติม:

    • การตั้งค่าแชทขั้นสูง (Advanced Chat Settings): อาจรวมถึงการปรับแต่งการตอบสนองของ AI หรือโหมดการสนทนาที่เฉพาะเจาะจงมากขึ้น

    • การแชร์โน้ตบุ๊กแบบ "แชทเท่านั้น" (Chat-only Sharing): ช่วยให้คุณสามารถแชร์โน้ตบุ๊กกับผู้อื่นได้ โดยที่ผู้รับสามารถโต้ตอบกับ AI ได้ แต่ไม่สามารถแก้ไขหรือดาวน์โหลดแหล่งข้อมูลต้นฉบับได้ เหมาะสำหรับการทำงานร่วมกันที่ต้องการควบคุมการเข้าถึงข้อมูล

    • การวิเคราะห์การใช้งานโน้ตบุ๊ก (Notebook Analytics): ข้อมูลเชิงลึกเกี่ยวกับการใช้งานของคุณ เพื่อช่วยให้คุณเข้าใจพฤติกรรมการค้นคว้าและเพิ่มประสิทธิภาพการทำงาน

ตารางเปรียบเทียบ: NotebookLM ฟรี vs. NotebookLM Plus

คุณสมบัติ

NotebookLM (เวอร์ชันพื้นฐาน - ฟรี)

NotebookLM Plus (บริการเสียเงิน)

ค่าใช้จ่าย

ฟรี

มีค่าใช้จ่าย (ผ่าน Google One AI Premium หรือ Google Workspace)

จำนวนโน้ตบุ๊ก

สูงสุด 100

สูงสุด 500 (5 เท่า)

แหล่งข้อมูล/โน้ตบุ๊ก

สูงสุด 50

สูงสุด 250 (5 เท่า)

ขนาดแหล่งข้อมูล

500,000 คำ / 200MB ต่อแหล่งข้อมูล

2,500,000 คำ / 1GB ต่อแหล่งข้อมูล (5 เท่า)

ถาม-ตอบ (Chat Queries)

สูงสุด 50 ครั้ง/วัน

สูงสุด 250 ครั้ง/วัน (5 เท่า)

สรุปเสียง (Audio Generations)

สูงสุด 3 ครั้ง/วัน

สูงสุด 15 ครั้ง/วัน (5 เท่า)

คุณสมบัติพิเศษ

- การอ้างอิงแหล่งที่มา
- สรุปเนื้อหา
- ถาม-ตอบ
- สร้างบทเรียน
- แปลภาษา
- ดึงข้อมูลจาก URL/ไฟล์

- คุณสมบัติทั้งหมดของเวอร์ชันฟรี
- การตั้งค่าแชทขั้นสูง
- การแชร์แบบ "แชทเท่านั้น"
- การวิเคราะห์การใช้งาน

เหมาะสำหรับ

บุคคลทั่วไป, นักเรียน, นักศึกษา, ผู้ใช้งานทั่วไปที่ต้องการจัดการข้อมูลส่วนตัว

นักวิจัยมืออาชีพ, องค์กรขนาดเล็กถึงกลาง, ผู้ใช้งานที่ต้องการประสิทธิภาพสูงและฟีเจอร์การทำงานร่วมกัน

-------------------------------------------------------------------------------------------------------------------------------------
บทความนี้ได้หาข้อมูล แล้วสอบถามเพิ่มโดยการ ยกตัวอย่างการใช้งานหลายๆรูปแบบกับ Gemini AI จากนั้นได้ขอให้ เรียบเรียง เพิ่มเติมข้อมูลในส่วนรูปแบบการให้บริการ แล้ว สร้างราตางเปรียบเทียบ สำหรับโพตส์ลงบล็อก