13. Alexa

Trợ lý Alexa với công nghệ kích hoạt bằng giọng nói đã trở lên phổ biến tại nhiều căn nhà trên thế giới với hàng triệu lượt tương tác mỗi ngày. Amazon đã bán trên 100 triệu sản phẩm – và là động lực to lớn để phát triển các kỹ năng cho trợ lý Alexa. Hiện tại, thiết bị này sở hữu khoảng 70,000 kỹ năng, mỗi kỹ năng được thêm vào giúp làm tăng giá trị và độ phổ biến cho sản phẩm này.

Hành trình biến công nghệ tương tác bằng giọng nói thành trải nghiệm thường ngày.

Alex, thời tiết hôm nay thế nào? Alexa, đặt chuông báo thức lúc 3:30. Alexa, Brazil đã tổ chức World Cup vào năm nào? Alexa, chơi bài hát “Purple Rain” của Prince.

Trợ lý Alexa với công nghệ kích hoạt bằng giọng nói đã trở lên phổ biến tại nhiều căn nhà trên thế giới với hàng triệu lượt tương tác mỗi ngày. Amazon đã bán trên 100 triệu sản phẩm – và là động lực to lớn để phát triển các kỹ năng cho trợ lý Alexa. Hiện tại, thiết bị này sở hữu khoảng 70,000 kỹ năng, mỗi kỹ năng được thêm vào giúp làm tăng giá trị và độ phổ biến cho sản phẩm này.

Sự thành công và ảnh hưởng bất ngờ của Alexa được bắt được bắt đầu một các vô cùng thầm lặng. Amazon mua lại startup YAP về nhận diện giọng nói vào năm 2011, cựu phó chủ tịch nghiên cứu Jeff Adams và nhóm kỹ thuật của công đã bay đến trụ sở Amazon mà không được chia sẻ bất kỳ thông tin nào trước đó. Chỉ một lần duy nhất khi nhóm tóm tắt ngay tại chỗ về ý tượng dự án mật này của Amazon: tạo ra một hệ thống nhận dạng giọng nói cho phép người sử dụng tương tác với loa thông minh từ bất cứ đâu trong căn phòng mà không cần bất kỳ màn hình nào.

“Phản hồi đầu tiên của tôi là ‘Tôi xin lỗi, điều đó không thể thực hiện,’” nói bởi Adam. Amazon đã không bị ngăn cản. “Họ biết đây là một hành động đưa tên lửa lên mặt trăng,” Adams chia sẻ thêm. “Tôi đã được yêu cầu phải làm mọi điều cần thiết để biến điều này thành hiện thực.”

Các nhà tài trợ ban đầu đã hy vọng dự án kết trong vòng chín tháng, nhưng đến cuối đã phải mất ba năm với một khối ngân sách khổng lồ 200 triệu đô la Mỹ cho riêng phần công nghệ nhận diện tiếng nói.

Mức chi phí cao cho dự án cũng không ngăn cản Jeff Bezos của CEO Amazon. “Đối với nguồn lực tài chính của Amazon, một khi chúng tôi có thể chứng minh rằng bằng việc nỗ lực hết mình chúng tôi có thể biến điều này thành hiện thực, Amazon sẽ cam kết về nguồn lực,” Adams chia sẻ. “Họ hiểu rằng đây là một vấn đề đáng để tìm ra câu trả lời.” Cuộc hành trình đã được chứng minh là một kỷ niệm đáng nhớ.

 “Đối với nguồn lực tài chính của Amazon, một khi chúng tôi có thể chứng minh rằng bằng việc nỗ lực hết mình chúng tôi có thể biến điều này thành hiện thực, Amazon sẽ cam kết về nguồn lực. Họ hiểu rằng đây là một vấn đề đáng để tìm ra câu trả lời.”

JEFF ADAMS

CỰU PHÓ CHỦ TỊCH CỦA STARTUP YAP – NHẬN DIỆN GIỌNG NÓI

Tiếng ồn và tín hiệu

Tại Amazon, những cố gắng thực hiện Alexa được gọi là Dự án D. “Không một ai biết chúng tôi đang làm gì,” Adam nói. Trước đó, Amazon đã đề ra ba ý tưởng khởi tạo tuyệt mật, từ máy đọc sách điện tử Kindle cho đến sự thất bại thảm hại của dòng điện thoại thông minh Fire Phone. Một thất bại lớn có thể sẽ khiến một số công ty phải suy xét lại công việc của phòng thí nghiệm, nhưng Amazon đã rất bình tĩnh đối diện với sự thất bại này, chia sẻ bởi Ahmed Bouzid, cựu trưởng ban sản phẩm của nhóm dự án Alexa.

“Đây là văn hóa của Amazon khi mà thất bại được coi là cơ hội để học hỏi,” Bouzid giải thích, hiện đang là CEO của Witlingo, công ty phát triển kỹ năng cho Alexa. “Nhiều thành viên trong nhóm dự án cho rằng họ đã làm những gì họ có thể và đã sẵn dàng để chuyển sang dự án kế tiếp.” Rất nhiều thành viên trong nhóm đã chuyển đến dự án Alexa.

Bất kỳ ai đã cố gắng đặt chuông báo thức bằng giọng nói khi đang nấu ăn hay nghe nhạc, trong thời gian đầu ra mắt công nghệ này, đều gặp phải khi khăn khi mà thiết bị không thể nhận biết được ngôn ngữ con người từ khoảng cách quá xa. “Quá nhiều tiếng vang được tạo ra khi thiết bị thu thanh nhận được tám hay chín loại âm thanh ở những tần số khác nhau,” Adams chia sẻ. Tín hiệu trở nên lộn xộn và không thể nhận dạng được.

Để giải quyết thách thức này, Adams đã thành lập một nhóm gồm 60 nhà khoa học và kỹ sư ngôn ngữ giỏi nhất. Trong gần một năm, nhóm của ông đã tinh chỉnh các công nghệ trí tuệ nhân tạo để có khả năng phân tích lời nói của con người từ tiếng vang và tiếng động xung quanh. Sau đó, để giúp thiết bị có thể hiểu được loại ngôn ngữ mà người dùng đang sử dụng, nhóm dự án đã cập nhật cho thiết bị một lượng dữ liệu giọng nói khổng lồ. Dự án đã đi đến các địa điểm khác nhau trên đất nước và dành một năm thuê các nhân viên tạm thời – với giọng nói, cách nói và nhịp điệu nói khác nhau để đọc các đoạn hội thoại từ khoảng cách khác nhau. (Adam đã rời Amazon ngay sau khi Alexa ra mắt thị trường để thành lập công ty công nghệ giọng nói và ngôn ngữ Cobalt)

Tại thời điểm cuối của năm thứ ba, nhóm Alexa đã thành công với công nghệ tiếng nói với khả năng nhận biết và hiểu từ khoảng cách hơn 5 feet (1.5 mét). Đồng thời, các nhóm khác đang phát triền song song phần cứng cho loa Echo, thiết lập giọng nói cho Alexa và phát triển các ứng dụng như báo cáo tình hình thời tiết và thời gian, bật nhạc, cài đặt nhắc nhở và báo thức. Phiên bản Echo cuối cùng đã bao gồm khả năng nhận dạng giọng nói chỉ thông qua một lần gọi tên và một khi thiết bị nhận được tín hiệu sẽ kích hoạt một công cụ nhận dạng giọng nói thứ hai hoạt động dựa trên dữ liệu đám mây để hiểu những gì người dùng nói, nhận câu hỏi và phản hồi.

David Attwater, một chuyên gia về trải nghiệm người dùng tại Enterprise Integration Group cho biết, việc cho phép các bên thứ ba xây dựng các ứng dụng cho nền tảng này là một phần quan trọng trong chiến lược của Amazon. Người sử dụng hầu như chỉ sử dụng một phần nhỏ tính năng của Alexa, trong khi Alexa có một số lượng tính năng đa dạng để người sử dụng lựa chọn. Từ quan điểm của dự án, trưởng nhóm Attwater nói, nhóm nghiên cứu đã cân nhắc kỹ lưỡng về những tính năng hữu ích và cung cấp một giải pháp chu toàn.

Tại thời điểm bắt đầu dự án, Amazon đã tính toán sẽ có một Echo Dot – loa thông minh đi kèm với công nghệ Alex, với giá bán là 50 đô la Mỹ. Tới thời điểm ra mắt, chi phí dự án đã khiến giá thành sản phẩm lên đến 200 đô la Mỹ. Amazon đã đưa sản phẩm ra thị trường dưới hình thức thử nghiệm, cho một nhóm khách hàng được mời vào tháng 11 năm 2014. “Đến tháng 6, sự thành công của sản phẩm đã được nhìn thấy rõ ràng,” chia sẻ bởi Bouzid.

Kể từ đó, Alexa vẫn chưa chuyển được chuyển thành một sản phẩm riêng biệt, mà được tích hợp vào hệ thống âm thanh nổi tại nhà và kết nối với xe hơi qua ổ cắm ngoài, máy hút bụi, đèn để bàn, gương phòng tắm, tivi, hệ thống báo cháy và điều chỉnh nhiệt độ.

“Chúng ta đang dần nhận ra sự hữu ích của công nghệ tương tác bằng tiếng nói đối với cuộc sống hằng ngày,” - David Hakanson, phó chủ tịch, giám đốc thông tin và sáng tạo tại Đại học Saint Louis, nơi tổ chức một cuộc thi cho sinh viên về phát triển kỹ năng Alexa, tại Missouri, Hoa Kỳ. Chia sẻ bởi Bouzid: “Chúng ta đã không tạo ra một nền tảng, chúng ta đã giúp tạo ra một ngành công nghiệp .”


Nguồn: https://mip.pmi.org/alexa

Xem thêm:

TOP 50 dự án có ảnh hưởng nhất trong vòng 50 năm qua.

Thông tin liên hệ

Thông tin chuyển khoản
Công ty Cổ phần ATOHA. Ngân hàng Á Châu (ACB). Số tài khoản: 6868 2468, PGD Tân Sơn Nhì, TPHCM.
Đăng ký khóa học
Chọn khóa học phù hợp bằng cách điền thông tin như link bên dưới. Tư vấn viên Atoha sẽ liên hệ anh/chị ngay.
Câu hỏi thường gặp

“Có. Atoha sẽ có chứng nhận hoàn thành chương trình đào tạo dành cho học viên và cung cấp 35 giờ đào tạo bắt buộc (1 trong 3 điều kiện thi lấy chứng chỉ PMP quốc tế)."

“Cả 2. Tài liệu có thể là tiếng Anh hoặc tiếng Việt tùy vào lớp. Atoha có thể đào tạo bằng cả tiếng Anh hoặc tiếng Việt."

“Chưa bao gồm. Học viên sẽ cần đóng phí thi trực tiếp cho viện PMI nếu muốn đăng ký thi, phí thi tham khảo như sau: 389 USD/non-member và 393 USD/member (trong đó phí thành viên PMI là 99 USD, phí admin là 10 USD, phí thi PMP là 284 USD). Chi phí này dành cho một số khu vực, trong đó có Việt Nam. Tham khảo thêm tại: www.pmi.org"

Liên hệ ngay với Atoha để được tư vấn về chương trình phù hợp