ChatTTS es un modelo de generación de voz diseñado para escenarios conversacionales, específicamente para las tareas de diálogo de…
ChatTTS - Texto a Voz para Escenarios Conversacionales
¿Qué es ChatTTS?
ChatTTS es un modelo de generación de voz diseñado para escenarios conversacionales, específicamente para las tareas de diálogo de asistentes de modelos de lenguaje grandes (LLM), así como aplicaciones como introducciones de audio y video conversacionales. Admite tanto el chino como el inglés, y a través del uso de aproximadamente 100,000 horas de datos de entrenamiento en chino e inglés, ChatTTS demuestra alta calidad y naturalidad en la síntesis del habla.
Funciones de ChatTTS
Retoque
Utiliza las herramientas de selección de Krita para marcar un área y eliminar o reemplazar el contenido existente en la imagen. Se pueden usar simples indicaciones de texto para guiar la generación.
Extrapolar
Extiende tu lienzo, selecciona un área en blanco y automáticamente llénalo con contenido que se integre de forma perfecta en la imagen existente.
Generar
Crea nuevas imágenes desde cero describiéndolas con palabras o imágenes existentes. Compatible con SD1.5 y SDXL.
Refinar
Utiliza el control deslizante de intensidad para refinar el contenido de la imagen existente en lugar de reemplazarlo por completo. ¡Esto también funciona muy bien para agregar cosas nuevas a una imagen pintando una aproximación (rudimentaria) y refinando con alta intensidad!
Pintura en Vivo
Permite que la IA interprete tu lienzo en tiempo real para obtener retroalimentación inmediata. Ver video
Control
Dirige la creación de imágenes directamente con bocetos o arte lineal. Utiliza mapas de profundidad o normales de imágenes existentes o escenas en 3D. Transfiere la postura de un personaje desde instantáneas. Controla la composición con mapas de segmentación.
Resoluciones
Trabaja eficientemente en cualquier resolución. El complemento utilizará automáticamente resoluciones apropiadas para el modelo de IA y las escalará para ajustarse a la región de tu imagen.
Ampliación
Amplía y enriquece imágenes a 4k, 8k y más allá sin quedarte sin memoria.
Cola de Trabajos
Dependiendo del hardware, la generación de imágenes puede llevar algo de tiempo. El complemento te permite encolar y cancelar trabajos mientras trabajas en tu imagen.
Historial
No todas las imágenes resultarán ser obras maestras. Previsualiza los resultados y navega entre generaciones y indicaciones anteriores en cualquier momento.
Predeterminados Potentes
Los versátiles ajustes predeterminados de estilo permiten una interfaz de usuario sencilla que abarca muchos escenarios.
Personalización
Crea tus propios ajustes preestablecidos: selecciona un punto de control de Difusión Estable, agrega LoRA, ajusta samplers y más.