Máy Tính

NotebookLM Audio Overviews: Từ Hoài Nghi Đến Bất Ngờ Với Tính Năng Podcast AI Đỉnh Cao

Màn hình chào mừng NotebookLM trên iPad, hiển thị giao diện thân thiện với người dùng

NotebookLM từ lâu đã được biết đến là một công cụ xuất sắc trong việc khơi gợi ý tưởng, tóm tắt nội dung và cung cấp nhiều phương pháp đa dạng để nghiên cứu tài liệu. Tuy nhiên, khi lần đầu tiên nghe về tính năng Audio Overviews – khả năng tạo ra các podcast do AI tạo sinh từ các nguồn tài liệu của bạn – kỳ vọng của tôi khá thấp.

Thế nhưng, chỉ sau một lần sử dụng, tôi nhận ra tại sao đây lại là một trong những lý do hàng đầu để tích hợp NotebookLM vào quy trình làm việc của mình. Mặc dù định dạng này có thể không phù hợp với mọi trường hợp sử dụng, nhưng nó là một phương pháp tuyệt vời để nhanh chóng tiếp cận sâu vào một chủ đề liên quan đến các nguồn tài liệu của bạn.

Vì sao tôi từng hoài nghi về Audio Overviews?

Không phải lúc nào cũng tin tưởng vào AI tạo sinh

Mặc dù công nghệ chuyển văn bản thành giọng nói (text-to-speech) đã có những bước tiến vượt bậc so với các phiên bản sơ khai, chất lượng vẫn có sự khác biệt đáng kể tùy thuộc vào nguồn của hệ thống tổng hợp giọng nói. Ví dụ, tính năng chuyển văn bản thành giọng nói trong cài đặt trợ năng của máy tính có thể nghe rất “robot” (như trường hợp tôi đã thử nghiệm trên PC Windows 11 của mình).

Ngay cả đối với AI được thiết kế để phát âm tự nhiên hơn, chẳng hạn như giọng đọc do AI tạo ra trong một số video YouTube, giọng nói thường nghe rất kỳ lạ. Nhịp điệu, ngữ điệu không tự nhiên và việc phát âm sai một số từ thường tố cáo bản chất được tạo ra bởi AI của giọng đọc đó.

Điều này không chỉ giới hạn ở giọng nói mà còn ở văn bản được tạo ra bởi AI tạo sinh. Nhiều người trong chúng ta có thể dễ dàng nhận ra văn bản do AI tạo ra trên mạng xã hội và các trang web, ngay cả khi ngôn ngữ sử dụng hoàn toàn đúng ngữ pháp.

Tôi đã nghe nhiều lời khen ngợi về NotebookLM nhưng hầu hết đều bỏ qua, cho rằng đó là sự cường điệu. Rốt cuộc, kinh nghiệm của tôi với các công cụ AI chủ yếu là những kỳ vọng cao và sau đó là sự thất vọng. Tuy nhiên, Audio Overviews lại là một trong những tính năng mà NotebookLM thực hiện tốt hơn so với các đối thủ cạnh tranh.

Màn hình chào mừng NotebookLM trên iPad, hiển thị giao diện thân thiện với người dùngMàn hình chào mừng NotebookLM trên iPad, hiển thị giao diện thân thiện với người dùng

Audio Overviews đã vượt xa kỳ vọng như thế nào?

Giọng nói nhân tạo nhưng tự nhiên đáng kinh ngạc

Tôi đã thử nghiệm tính năng Audio Overviews với nhiều chủ đề khác nhau và nhận thấy kết quả vượt xa mong đợi. Các “host” (người dẫn chương trình AI) nghe tự nhiên, dường như phản ứng với lời nói của người còn lại và bắt chước giọng nói của con người bằng cách bao gồm các khoảng dừng, từ đệm như “ừm,” và thậm chí cả đôi khi nói lắp.

Mặc dù bạn sẽ luôn có hai người dẫn chương trình, một nam và một nữ, nhưng họ thích ứng với các nguồn bạn sử dụng và tông giọng của chủ đề. Ví dụ, đối với phần tổng quan về một chủ đề y tế, các “host” nghe nghiêm túc và đồng cảm hơn. Ngược lại, đối với một chủ đề đời thường hơn, như xu hướng công nghệ hoặc cách thuần hóa một loài khủng long nhất định trong trò chơi Ark: Survival Evolved, các “host” nghe vui vẻ và lạc quan hơn.

NotebookLM tạo ra nội dung dựa trên các nguồn bạn cung cấp. Điều này giúp bạn tránh thông tin không chính xác bằng cách giới hạn các nguồn vào những trang web và nội dung mà bạn tin tưởng. Mặc dù tôi đã phát hiện một lỗi trong tính năng Timeline của NotebookLM, nhưng tính năng tạo văn bản và Audio Overviews của nó chưa bao giờ tạo ra hiện tượng “ảo giác” AI (AI hallucinations) cho tôi – một nhược điểm thường xuyên tôi gặp phải khi sử dụng các công cụ AI khác.

Nếu bạn đang tìm cách tiếp cận một chủ đề một cách dễ hiểu và hấp dẫn, tôi thực sự khuyên bạn nên thử Audio Overviews. Tính năng này được bao gồm trong gói miễn phí của NotebookLM, mặc dù bạn chỉ có thể tạo một số lượng bản ghi âm nhất định trong một ngày.

Khả năng hỗ trợ đa ngôn ngữ ấn tượng

Audio Overviews cũng có một vài tính năng vẫn đang trong giai đoạn thử nghiệm (beta) – đó là chế độ Tương tác (Interactive mode) và khả năng tạo podcast không phải tiếng Anh. Vì khả năng hỗ trợ ngôn ngữ chính xác là điều tôi hiếm thấy ở các công cụ AI, tôi muốn thử tính năng này bằng một ngôn ngữ khác.

Mặc dù không có cách nào để thay đổi một Audio Overview cụ thể sang một ngôn ngữ khác, bạn có thể thay đổi ngôn ngữ đầu ra mặc định cho NotebookLM. Điều này cho phép bạn tạo các podcast mới bằng ngôn ngữ đã chọn sau đó.

Để thay đổi ngôn ngữ đầu ra, bạn chọn Cài đặt -> Ngôn ngữ đầu ra (Settings -> Output language) và chọn từ một trong các ngôn ngữ được hỗ trợ. Trong khi các công cụ AI tạo sinh thường chỉ hỗ trợ một vài ngôn ngữ, NotebookLM hỗ trợ Audio Overviews cho hàng chục ngôn ngữ, bao gồm tiếng Ả Rập, tiếng Trung, tiếng Đan Mạch, tiếng Philippines, tiếng Tây Ban Nha, tiếng Swahili, và nhiều ngôn ngữ khác.

Tôi đã chọn tiếng Afrikaans làm ngôn ngữ đầu ra, vì đây là ngôn ngữ thứ hai của tôi. Sau đó, tôi tạo lại bản Audio Overview về bệnh fibromyalgia để xem bản dịch có chính xác đến mức nào, cũng như ngữ điệu của các “host” sẽ tự nhiên ra sao.

Mặc dù ngữ điệu tiếng Afrikaans của các “host” cảm thấy kém tự nhiên hơn một chút so với tiếng Anh, nhưng họ vẫn thể hiện sự thành thạo ngôn ngữ. Tôi cũng không thể phát hiện bất kỳ lỗi nào trong từ vựng hoặc ngữ pháp thực tế của các “host”.

Để kiểm tra lại sự lưu loát của họ, tôi cũng nhờ một người bạn nghe bản podcast đã tạo ra để xem anh ấy có thể phát hiện lỗi nào không, vì tiếng Afrikaans là tiếng mẹ đẻ của anh ấy. Anh ấy chủ yếu chỉ ra một vài điểm phát âm chưa chuẩn, cũng như một vài trường hợp dịch trực tiếp nghe không hoàn toàn tự nhiên. Nhìn chung, bản ghi âm khá tốt – nhưng chưa hoàn hảo. Tuy nhiên, tôi đã rất ngạc nhiên về khả năng thể hiện của các “host” đối với một ngôn ngữ được khoảng 7,5 triệu người nói.

Tương lai nào cho Audio Overviews?

Audio Overviews là một trong những tính năng hứa hẹn nhất của NotebookLM, nhưng hiệu quả của nó cũng phụ thuộc vào cách người dùng sử dụng. Tôi không nghĩ rằng nó sẽ thay thế hoàn toàn (hoặc một cách đạo đức) các podcast do con người thật tạo ra. Tuy nhiên, đây chắc chắn là một cách tuyệt vời để tìm hiểu sâu về các chủ đề một cách nhanh chóng và hấp dẫn. Tôi mong muốn tính năng này sẽ được bổ sung thêm bản chép lời (transcripts) trong tương lai, và tôi tin rằng đây là một trong những cải tiến mà NotebookLM nên giới thiệu.

Với NotebookLM Audio Overviews, bạn không chỉ tiết kiệm thời gian mà còn có thể tiếp cận kiến thức một cách mới mẻ, đặc biệt là khi bạn bận rộn. Hãy trải nghiệm ngay tính năng này và khám phá tiềm năng của việc học tập và nghiên cứu bằng AI tại congnghemoi.net!

Related posts

7 Thủ Thuật Nâng Cao Giúp Bạn Tối Ưu Joplin Như Một Chuyên Gia

Administrator

Windows 11 Nâng Cấp: OneDrive Giúp Chuyển Đổi Công Việc Liền Mạch

Administrator

NotebookLM: Cách AI của Google Đột Phá Quy Trình Nghiên Cứu và Phân Tích Thông Tin Của Bạn

Administrator