Speech2Face được nghiên cứu để nhận dạng một số đặc điểm trên khuôn mặt và tái tạo lại khuôn mặt của mọi người chỉ bằng cách lắng nghe âm thanh giọng nói của họ.

Bạn có thể đã nghe nói về máy ảnh được hỗ trợ bởi AI (trí tuệ nhân tạo) có thể nhận ra mọi người chỉ bằng cách phân tích các đặc điểm trên khuôn mặt của họ, nhưng điều gì sẽ xảy ra nếu có một cách để trí thông minh nhân tạo tìm ra bạn trông như thế nào chỉ bằng âm thanh của giọng nói và không cần so sánh giọng nói với cơ sở dữ liệu?

Đó chính xác là những gì mà một nhóm các nhà khoa học tại Phòng thí nghiệm Khoa học Máy tính và Trí tuệ Nhân tạo MIT (CSAIL) đã và đang nghiên cứu, kết quả công việc của họ thật ấn tượng.

Mặc dù thuật toán AI có tên là có tên là Speech2Face, vẫn chưa thể tìm ra các đặc điểm khuôn mặt chính xác của con người chỉ bằng giọng nói của họ, nhưng nó chắc chắn có rất nhiều chi tiết đúng.

"Mô hình của chúng tôi được thiết kế để tiết lộ các mối tương quan thống kê tồn tại giữa các đặc điểm trên khuôn mặt và giọng nói của người nói.

Dữ liệu đào tạo mà chúng tôi sử dụng là tập hợp các video giáo dục từ YouTube và không đại diện cho toàn bộ dân số thế giới", những người sáng tạo của Speech2Face cho biết.

Thiết bị có thể tạo ra hình dáng khuôn mặt chỉ bằng giọng nói của bạn.

Bạn có thể nói rất nhiều điều về một người từ cách họ nói chuyện một mình. Ví dụ, bạn rất có thể biết ai đó là nam hay nữ hay họ già hay trẻ, nhưng Speech2Face còn vượt xa hơn thế.

Nó có thể xác định khá chính xác hình dạng của mũi, xương gò má hoặc hàm của ai đó chỉ từ giọng nói của họ, bởi vì cách cấu tạo của mũi và các xương khác trên khuôn mặt của chúng ta quyết định cách chúng ta phát âm.

Chủng tộc cũng là một trong những điều mà Speech2Face có thể xác định chính xác khi nghe giọng nói của ai đó chỉ trong vài mili giây, vì những người đến từ cùng một nhóm có xu hướng có các thuộc tính giống nhau.

AI có tính đến nhiều yếu tố khác nhau và đôi khi nó tạo ra kết quả ấn tượng, nhưng nó vẫn đang trong quá trình phát triển.

Có một số trường hợp AI gặp khó khăn trong việc hình dung người nói trông như thế nào. Các yếu tố như trọng âm, ngôn ngữ và cao độ giọng nói là những yếu tố gây ra sự không khớp giữa giọng nói và khuôn mặt, trong đó giới tính, tuổi tác hoặc dân tộc không chính xác.

Những người có giọng cao (bao gồm cả các bé trai) thường được coi là nữ trong khi những người có giọng thấp được coi là nam. Một người đàn ông châu Á nói tiếng Anh dẫn đến ngoại hình không giống người châu Á hơn so với khi anh ta nói tiếng Trung Quốc.

Tuy nhiên, bất chấp những hạn chế của nó, Speech2Face mang đến một cái nhìn về tương lai của công nghệ trí tuệ nhân tạo gây ấn tượng và khiến hầu hết mọi người phải khiếp nể phục.

Hãy tưởng tượng một tương lai mà chỉ vài mili giây thời gian thoại là đủ để mạng nơ-ron ghép lại với nhau một bức chân dung chính xác.

Chắc chắn, nó có thể giúp xác định tội phạm, nhưng điều gì để ngăn những kẻ xấu sử dụng công nghệ tương tự cho các mục đích bất chính?

Hà Nội
86%
26°C
Xấu
152 US AQI
Xấu Nhóm nhạy cảm tránh ra ngoài. Những người khác hạn chế ra ngoài
Ho Chi Minh City
94%
25°C
Tốt
35 US AQI
Tốt Không ảnh hưởng đến sức khỏe

Cập nhật lúc 03:15:02 01/07/2022(Theo AirVisual)

Ghi chú: Nhóm nhạy cảm bao gồm trẻ em, người già và những người mắc bệnh hô hấp.

Tuệ An / Giáo Dục Thời Đại

Nguồn: https://giaoducthoidai.vn/chuyen-la/doc-la-thiet-bi-co-the-tao-ra-hinh-dang-khuon-mat-bang-giong-noi-i1QOd2lng.html