Skip to content

ViViT & CNN and RNN

Dmitry Sirakov edited this page May 12, 2023 · 1 revision

First NN in notebook(ViViT):
Test accuracy: 60.22%
Test recall: 95.83%
Test precision: 61.46%
Test F1: 73.1%

Second NN in notebook(CNN-RNN):
Test accuracy: 72.04%
Test recall: 100%
Test precision: 60.20%
Test F1: 75.17%

Если будем использовать это решение, то нам нужно протестировать и разметить видео в таком формате: 1c, 5c, 10с для детектирования драки(поиск оптимального 'фрейма' для того, чтобы модель считывала контекст движений). Потому что в модели используется RNN, точно такие же исследования нужно провести и на модели с LSTM.

Тогда мы сможем выдавать таймкода видоса и сам фрагмент, где у нас происходит драка, если она действительно происходит.

Metrics

Metrics

Clone this wiki locally