Cámara Raspberry Pi usa sonido para crear fotos con IA

¿Qué es ese sonido? ¡Deja que esta cámara ciega te muestre!

Dicen que una imagen vale más que mil palabras, pero ¿podrían mil palabras valer una imagen? El creador y desarrollador Diego Trujillo Pisanty buscó averiguarlo con su proyecto de cámara ciega con tecnología Raspberry Pi. En lugar de usar una lente para capturar la luz para hacer una imagen, escucha el sonido y construye una aproximación de lo que podría estar a su alrededor en función del audio detectado.

El dispositivo funciona de manera similar a una cámara normal en el sentido de que apunta la cámara a lo que desea capturar y presiona un botón para generar una imagen. En este caso, sin embargo, tiene una bocina gigante en la parte delantera que ayuda a amplificar la captura de sonidos. Los usuarios deben apuntar este cuerno en la dirección de lo que quieren capturar antes de presionar el botón. Luego, la cámara analiza el audio a través de un filtro de IA y genera una imagen.

Según Pisanty, desarrolló una red neuronal artificial personalizada (o ANN) solo para este proyecto. Entrenó a la IA con sus propios modelos basados en un conjunto de videos tomados en la Ciudad de México.

El modelo fue creado tomando cada cuadro de video y acompañándolo con el último segundo de audio. Esto ayudó a construir una asociación de sonido y video que el sistema puede usar para crear imágenes. Debido a que fue entrenado de esta manera, todo lo que crea se basa libremente en imágenes del centro de la Ciudad de México.

Para este proyecto, Pisanty está utilizando un módulo Raspberry Pi 3B. Sin embargo, sería posible recrearlo usando una Raspberry Pi 4. Siempre que Pi pueda manejar Tensorflow, debería funcionar. La cámara también tiene una pequeña pantalla que sirve como una especie de visor. Permite a los usuarios saber cuándo se están procesando las imágenes y proporciona una vista previa de las imágenes generadas. Todo está alojado dentro de una carcasa personalizada impresa en 3D.

El modelo de IA utilizado para entrenar la cámara ciega se creó con Python 3. Está diseñado para funcionar con Tensorflow 2 y se ejecuta en Raspberry Pi con TFLite. Si desea recrear este proyecto de Raspberry Pi o simplemente ver más de cerca cómo funciona, vea el video compartido por Pisanty en YouTube y lea más sobre el proyecto en su sitio web.

Únase a los expertos que leen Tom's Hardware para obtener información privilegiada sobre las noticias de tecnología de PC para entusiastas, y lo han hecho durante más de 25 años. Enviaremos noticias de última hora y reseñas detalladas de CPU, GPU, IA, hardware de fabricante y más directamente a su bandeja de entrada.

Ash Hill es un escritor independiente de noticias y reportajes en Tom's Hardware US. Administra los proyectos Pi del mes y gran parte de nuestros informes diarios de Raspberry Pi.

Las gafas de visión nocturna Raspberry Pi te permiten ver de noche

Seeed anuncia reTerminal DM Raspberry Pi All-in-One de 10 pulgadas

La poderosa herramienta Gen-2 de texto a video de Runway ahora está disponible para todos de forma gratuita

Por Ash Hill 7 de junio de 2023

Por Les Pounder 07 de junio de 2023

Por Stewart Bendle 7 de junio de 2023

Por Ash Hill 7 de junio de 2023

Por Jarred Walton 6 de junio de 2023

Por Aaron Klotz 6 de junio de 2023

Por Anton Shilov 6 de junio de 2023

Por Zhiye Liu 6 de junio de 2023

Por Anton Shilov 6 de junio de 2023

Por Mark Tyson 6 de junio de 2023

Por Aaron Klotz 6 de junio de 2023

Noticias