Yapay zeka ile ses klonlama aracı: Fish Audio
Canlı, ifadeli ve duygusal açıdan zengin bir yazıdan konuşmaya modeli olan Fish Audio ; kurucularının iddia ettiği üzere en gerçekçi şekilde ritim ve nüansı yakalayan, canlı gibi duran sesler üretiyor. Fish Audio ses klonlama ise 10 saniyeye kadar inebilen bir ses girdisiyle doğala yakın bir klon oluşturabiliyor. Bunu yaparken de aksanı, tonu ve konuşma alışkanlıklarını korumaya özen gösteriyor. Aracın So-VITS-SVC ve Bert-VITS2’nin arkasındaki açık kaynak ekibi tarafından üre
Fish Audio, canlı ve duygusal bir ses üretimi sağlayan bir yapay zeka aracıdır. Kurucularına göre, sesin ritim ve nüansını gerçekçi şekilde yakalar. 10 saniyelik bir ses girdisiyle doğal bir klon oluşturur. Aksan, ton ve konuşma alışkanlıklarını korur. Aracın geliştiricisi açık kaynak ekibi tarafından oluşturulmuştur. Fish.audio adresine gidip bir hesap oluşturmak yeterlidir. Kullanıcı, siteye yüklenmiş sesleri veya kendi sesini kullanarak ses klonlama yapabilir. Dilerseniz kendi ses dosyanızı yükleyebilirsiniz. Türkçe ses girdisiyle bazı aksan ve inceltme sorunları olabilir. Ancak şiirsel bir ses girdisiyle daha iyi sonuçlar elde edilebilir. İngilizce girdiyle daha pürüzsüz sonuçlar alınabilir. 10 saniyelik bir girdiyle benzer bir ses elde edilebilir. Daha yüksek bir yakınlık için 90 saniyelik bir girdi kullanmak önerilir. Aracın ses modelleri arasında S1, V1.6 Control Beta ve V1.5 bulunur. Metinden konuşmaya özelliğini kullanmak için belirli bir ses seçilmelidir. Duygusal ve tonsal eklemeler yapılabilir. Ancak bazı kullanıcılar daha dramatik sonuçlar elde etmemiştir. Ücretsiz sürümde 8 bin krediye erişim vardır. Plus planında yıllık 132 dolar veya aylık 11 dolarla daha fazla kredi ve özelliklere erişim sağlanabilir.
Yapay zeka teknolojisiyle ses klonlama, ses üretimi ve ses işleme alanlarında önemli gelişmeler sağlar.
📌 Kaynak
Bu özet Turkey kaynağından otomatik derlenmiştir. Tamamı için orijinal habere gidin.
Orijinal haberi oku →