Este proyecto es un prototipo de un sistema de control de la computadora a través de gestos. El sistema se basa en la detección de gestos a través de una cámara web y la ejecución de acciones en la computadora en función de los gestos detectados.
El sistema cuenta con las siguientes funcionalidades:
-
Recibir comandos de voz: El sistema recibe comandos de voz para escribir texto en la computadora:
- "escribir": Comenzará a escribir el texto que se le dicte. - "enter": Presiona un salto de línea. - "abrir": Buscará en el menú de inicio la aplicación que se le dicte y la abrirá. - "cerrar": Cerrará la aplicación actualmente activa. - "finalizar": Finalizará la ejecución del programa.
-
Control del mouse: El sistema detecta la posición de la mano y los dedos a través de la cámara web y mueve el cursor del mouse en función de la posición de la mano.
Las siguientes librerías se encuentran listadas en el archivo requirements.txt
y son necesarias para ejecutar el proyecto:
- opencv-python
- mediapipe
- SpeechRecognition
- pyautogui
- pyaudio
- setuptools
Para ejecutar el proyecto, sigue los siguientes pasos:
Si estás usando Visual Studio Code, puedes ejecutar la tarea win-init
o linux-init
para instalar las librerías necesarias:
-
Presiona
Ctrl + Shift + P
para abrir el menú de comandos. -
Escribe
Tasks: Run Task
y selecciona la opciónTasks: Run Task
. -
Selecciona la tarea
win-init
olinux-init
para instalar las librerías necesarias.
Esta tarea va a crear un entorno virtual, activarlo e instalar las librerías necesarias en el entorno virtual.
Si no estás usando Visual Studio Code, sigue los siguientes pasos:
-
Inicializa un entorno virtual (opcional)
-
Ejecuta el siguiente comando para instalar las librerías necesarias:
pip install -r requirements.txt
Ejecuta el siguiente comando para iniciar el sistema:
python main.py