VKIST face capture: Phần mềm thu thập dữ liệu ảnh khuôn mặt đa góc phục vụ nghiên cứu và phát triển AI

Thứ bảy, 27/09/2025 12:57

Phần mềm VKIST face capture hỗ trợ điều khiển đồng bộ hệ thống chụp ảnh khuôn mặt đa góc, kiểm soát ánh sáng và gán nhãn dữ liệu tự động, phục vụ xây dựng cơ sở dữ liệu hình ảnh chất lượng cao cho các nghiên cứu về thị giác máy tính và ứng dụng trí tuệ nhân tạo.

Trong bối cảnh các công nghệ nhận diện khuôn mặt và mô hình hóa khuôn mặt 3D ngày càng được ứng dụng rộng rãi trong nhiều lĩnh vực như an ninh, y tế, thương mại điện tử, bảo mật cá nhân, nhu cầu xây dựng cơ sở dữ liệu ảnh khuôn mặt có cấu trúc, đa dạng và quy mô lớn đang trở nên cấp thiết. Một trong những thách thức lớn hiện nay là làm sao thu thập được dữ liệu hình ảnh có chất lượng đồng nhất, dưới các điều kiện chiếu sáng khác nhau và ở nhiều góc chụp, đồng thời đảm bảo tính chính xác trong phân loại và lưu trữ dữ liệu.

Để giải quyết bài toán này, nhóm nghiên cứu tại Viện Khoa học và Công nghệ Việt Nam - Hàn Quốc (VKIST) đã phát triển phần mềm VKIST face capture, một công cụ hỗ trợ điều khiển đồng thời hệ thống gồm nhiều máy ảnh kỹ thuật số và mô-đun đèn chiếu sáng, cho phép thu thập, gán nhãn và lưu trữ dữ liệu ảnh khuôn mặt theo thời gian thực.

Giải pháp thu thập và xử lý dữ liệu ảnh khuôn mặt

VKIST face capture được lập trình bằng ngôn ngữ C#, nổi bật với giao diện thân thiện bằng tiếng Việt, dễ tích hợp và mở rộng.

VKIST face capture cho phép điều khiển từ xa các dòng máy ảnh DSLR phổ biến của Nikon và Canon như 5DmarkII, 5DMarkIII, 6DMarkII, 1500D, 2000D, D60, D3000, D5100, D7100, D4, D800..., thông qua giao tiếp USB và giao thức RS232. Người dùng có thể thực hiện các thao tác như xem hình ảnh trực tiếp (Live View), điều chỉnh thông số kỹ thuật (khẩu độ, tốc độ chụp, ISO), ra lệnh chụp ảnh đồng thời, và truyền ảnh ngay về máy tính trong thời gian thực.

Đặc biệt, phần mềm hỗ trợ điều khiển đồng thời nhiều máy ảnh - tính năng thiết yếu trong các hệ thống thu thập dữ liệu hình ảnh nhiều góc độ. Giao diện phần mềm bằng tiếng Việt, thiết kế theo khối chức năng riêng biệt giúp dễ sử dụng và dễ dàng tích hợp trong các hệ thống phức tạp.

Giao diện phần mềm VKIST face capture (Hình 1) được chia thành từng khối riêng biệt với các chức năng được mô tả trong Hình 2. Ngôn ngữ thể hiện trong phần mềm là ngôn ngữ Tiếng Việt.

img

Giao diện phần mềm VKIST face capture.

img

Sơ đồ các khối chức năng chính của phần mềm.

VKIST face capture còn tích hợp khả năng kiểm soát cường độ sáng của hệ thống đèn chiếu bằng cách truyền dữ liệu từ các tệp cấu hình tới mạch điều khiển ánh sáng. Nhờ đó, môi trường ánh sáng trong quá trình chụp được kiểm soát chính xác, đảm bảo chất lượng ảnh đồng đều là yếu tố then chốt trong các ứng dụng AI.

Ngoài ra chức năng kiểm soát cường độ ánh sáng cũng được tích hợp vào phần mềm này. Người dùng chỉ cần nhập tệp thông số cường độ ánh sáng có sẵn, sau đó sử dụng phần mềm để đọc dữ liệu và truyền thông số tới mạch điều khiển cường độ sáng. Từ đó, kiểm soát chính xác lượng ánh sáng trong môi trường xung quanh.

Một điểm nổi bật khác là khả năng gán nhãn dữ liệu tự động theo cấu, giúp quá trình quản lý, truy xuất, và huần luyện mô hình AI trở nên hiệu quả hơn. Phần mềm hỗ trợ tùy chọn chế độ lưu dữ liệu (cục bộ tại camera, lưu về máy tính) và phân loại dữ liệu theo kịch bản định sẵn.

Một đặc điểm nổi bật khác là khả năng gán nhãn ảnh tự động theo cấu trúc định sẵn, giúp tiết kiệm đáng kể thời gian phân loại thủ công. VKIST face capture cho phép cấu hình cách lưu ảnh: Theo thư mục, theo đối tượng, theo loại biểu cảm, hoặc các biến thể khác như đeo kính, đeo khẩu trang, đổi kiểu tóc...

Ngoài ra, phần mềm còn hỗ trợ nhiều chế độ lưu dữ liệu - bao gồm ghi tuần tự, ghi đè hoặc lưu tại máy ảnh trước khi chuyển về máy chủ. Điều này giúp hệ thống linh hoạt trong việc xử lý lượng ảnh lớn, giảm thiểu rủi ro mất dữ liệu hoặc tắc nghẽn trong quá trình vận hành.

Nền tảng nghiên cứu trí tuệ nhân tạo và xây dựng cơ sở dữ liệu khuôn mặt quy mô lớn

Phần mềm hiện đang được sử dụng tại hệ thống thu thập dữ liệu ảnh khuôn mặt do VKIST triển khai, gồm 33 camera Canon DSLR, 20 mô - đun đèn chiếu sáng có thể điều chỉnh thay đổi độ sáng, một bộ khung sắt để có thể đặt các máy ảnh và đèn chiếu sáng xung quanh hình bán cầu và ba bộ PC cấu hình mạnh kèm màn hình và phần mềm điều khiển hệ thống. Với hệ thống này, nhóm nghiên cứu Phòng thí nghiệm hợp tác VKIST-Nacentech/Phòng Công nghệ thông tin, VKIST đã và đang thu thập, xây dựng cơ sở dữ liệu (CSDL) ảnh khuôn mặt của khoảng 500 người (khoảng 5 triệu bức ảnh) và đang tiếp tục tiến hành thu thập thêm dữ liệu.

img

Mẫu dữ liệu ảnh mặt đa góc được thực hiện bởi phần mềm VKIST face capture.

Phần mềm đã được sử dụng trong các dự án hợp tác với Viện Khoa học và Công nghệ Hàn Quốc (KIST) nhằm thu thập dữ liệu ảnh khuôn mặt hơn 1000 người Việt. Kho dữ liệu này bao gồm khoảng 10 triệu bức ảnh với các biểu cảm khuôn mặt khác nhau như bình thường, vui vẻ, buồn, lo sợ, tức giận, ngạc nhiên, khó chịu và các phụ kiện che khuất như khẩu trang, kính mắt, mũ, tóc giả dưới nhiều điều kiện ánh sáng khác nhau.

img

Giao diện phần mềm với đầy đủ các thông số kỹ thuật.

Dữ liệu được thu thập từ hệ thống sử dụng phần mềm VKIST face capture đã và đang được ứng dụng trong nhiều hướng nghiên cứu và phát triển công nghệ:

Mô hình hóa khuôn mặt 3D từ ảnh 2D nhiều góc chụp,

Tăng độ chính xác của công nghệ nhận diện khuôn mặt trong điều kiện biến dạng (che khuất, ánh sáng phức tạp),

Khắc laser 3D khuôn mặt trên thủy tinh làm quà lưu niệm,

Tái dựng hình ảnh khuôn mặt người đã khuất từ ảnh cũ, phục vụ mục đích văn hóa và lưu trữ di sản,

Ứng dụng trong thương mại điện tử, thẩm mỹ y học, thực tế ảo tăng cường.

Việc phát triển và ứng dụng VKIST face capture không chỉ giúp VKIST chủ động trong xây dựng cơ sở dữ liệu lớn mà còn góp phần nâng cao năng lực nghiên cứu về thị giác máy tính và trí tuệ nhân tạo tại Việt Nam - những lĩnh vực cốt lõi trong cuộc cách mạng công nghiệp lần thứ tư.

Việc nắm bắt và làm chủ công nghệ phần mềm điều khiển hệ thống phần cứng chuyên biệt - đặc biệt là hệ thống quang học đa thiết bị - đóng vai trò quan trọng trong việc xây dựng các nền tảng AI nội địa phù hợp với đặc thù nhân trắc học của người Việt.

VKIST face capture là một minh chứng cho việc phát triển các công cụ phần mềm kỹ thuật cao phục vụ nghiên cứu và triển khai các hệ thống thị giác máy tính tại Việt Nam. Việc làm chủ công nghệ điều khiển và đồng bộ hóa hệ thống thu thập dữ liệu ảnh quy mô lớn sẽ là nền tảng quan trọng giúp đẩy mạnh năng lực phát triển trí tuệ nhân tạo trong nước, đặc biệt trong các lĩnh vực cần dữ liệu nhân trắc học có tính đặc thù theo khu vực hoặc dân tộc học.

Phòng công nghệ thông tin đã đăng ký quyền tác giả phần mềm "VKIST face capture" ngay sau khi hoàn thiện và thử nghiệm toàn bộ chương trình.

img

Giấy chứng nhận đăng ký quyền tác giả phần mềm VKIST face capture.

Viện Khoa học và Công nghệ Việt Nam - Hàn Quốc

Cổng thông tin điện tử các đơn vị thuộc Bộ

Doanh nghiệp

Top