HeyGen - Người phát ngôn AI Địa chỉ trang web chính thức của Video Creator.
Tạo địa chỉ api video (heygen.com).
Giới thiệu:
Công ty gần đây quan tâm nhiều hơn đến lĩnh vực kinh doanh AI, đặc biệt là trí tuệ nhân tạo tổng hợp AIGC. Sản phẩm trong nước vẫn đang trong giai đoạn thử nghiệm, những sản phẩm thực sự nhắm đến cấp c và b-end vẫn chưa đủ hoàn thiện.
Những ứng dụng phổ biến nhất là các ứng dụng biên như người kỹ thuật số phát sóng trực tiếp, người kỹ thuật số video ngắn, danh thiếp người kỹ thuật số, v.v. Bây giờ nhu cầu của chúng ta là kết nối với giao diện model của heygen và quan trọng hơn là tổng hợp video.
Tổng hợp ngôn ngữ là một giao diện để tạo video dựa trên các mẫu. Dưới đây là một số lớp công cụ ví dụ đơn giản và danh sách một số cạm bẫy mà bản thân tôi đã gặp phải để tránh quên khi lặp lại.
。
Công cụ.
。
Giao diện lắp ghép rất đơn giản nhưng còn một số cạm bẫy và điểm cần bổ sung.
1. Khi upload ảnh các khuôn mặt, giao diện của heygen hiển thị định dạng mã hóa base64, tôi tưởng cần phải chuyển sang định dạng base64 nhưng kết quả vẫn báo lỗi. Thực tế là do chính heygen chuyển đổi. tập tin thành một mảng byte.
2. Nếu nhu cầu của bạn không phức tạp đối với video và bạn chỉ cần một video kỹ thuật số do con người tạo ra, bạn có thể trực tiếp sử dụng giao diện tạo video. Việc gọi giao diện này sẽ trả về cho bạn một ID duy nhất của video, sau đó theo id video. để truy vấn trạng thái video, nếu thành công.
Nó sẽ trả về đường dẫn của video và đường dẫn của hình thu nhỏ video, tuy nhiên cần lưu ý là các link này sẽ hết hạn. Bạn có thể tự chuyển oss hoặc làm mới link thường xuyên.
3. Nếu bạn muốn trực tiếp tạo một số video phức tạp hơn, tôi khuyên bạn nên tạo một số mẫu trong mái vòm của trang web chính thức của heygen, sau đó thay thế chúng bằng mã theo định dạng trong các mẫu. Điều này sẽ dễ dàng hơn, nhưng khi có nhiều mẫu. mẫu, nó sẽ phức tạp hơn Xin lỗi vì sự cố, giải pháp của tôi là sử dụng.
Mẫu Strategist giải quyết một cách khéo léo vấn đề sử dụng nhiều mẫu yêu cầu mã hóa cứng.
4. Vì heygen chủ yếu kết nối với thị trường nước ngoài nên có tương đối ít âm thanh buổi trưa có thể dùng để tổng hợp video, nhưng cũng bao gồm giọng phổ thông, tiếng Quảng Đông và tiếng Đài Loan. Hiện có tổng cộng khoảng 382 âm thanh và sẽ có yêu cầu trực tiếp. rất khó khăn. Chậm nên tôi chỉ đơn giản là lập chỉ mục về phía mình.
Tất nhiên, bạn cũng có thể tải lên giọng nói của chính mình để tổng hợp video.
Lưu ý:
Điều rắc rối nhất là việc xử lý định dạng json. JSON được trả về bởi một mẫu có khoảng 160 dòng và được lồng trong nhiều lớp. Tôi sử dụng fastjson2 để tạo một đối tượng để chuyển đổi lẫn nhau. Nếu bạn có giải pháp tốt hơn, bạn có thể để lại tin nhắn và cho tôi biết.
。
Cuối cùng, bài viết này về cách sử dụng đơn giản phiên bản java của giao diện mô hình heygen kết thúc ở đây. Nếu bạn muốn biết thêm về cách sử dụng đơn giản phiên bản java của giao diện mô hình heygen, vui lòng tìm kiếm bài viết CFSDN hoặc tiếp tục duyệt qua phần liên quan. Tôi hy vọng bạn sẽ ủng hộ nó trong tương lai! .
Tôi là một lập trình viên xuất sắc, rất giỏi!