Dans cet article, nous passons en revue 300 références sur la recherche vidéo, indiquant lorsque le texte-que des solutions ne sont pas satisfaisantes et montrant le prometteur solutions de rechange qui sont en majorité basés sur les concepts. Par conséquent, de centre à notre discussion, c'est la notion d'un concept sémantique: un objectif description linguistique d'une entité observable. Plus précisément, nous présentons notre point de vue sur la façon dont sa détection automatique, la sélection dans l'incertitude, et l'utilisation interactive pourrait résoudre le problème scientifique majeur pour la vidéo recherche: le fossé sémantique. Pour combler l'écart, nous nous sommes couchés l'anatomie d'un concept de moteur de recherche vidéo basée sur. Nous présentons un composant-sage décomposition d'un tel système interdisciplinaire multimédia, couvrant les influences de la recherche d'information, vision par ordinateur, l’apprentissage machine, et interaction homme-ordinateur. Pour chacun des composants que nous examen état de l'art des solutions dans la littérature, chacun ayant différents caractéristiques et les mérites. En raison de ces différences, nous ne pouvons pas comprendre les progrès dans la récupération vidéo sans les efforts d’évaluation grave telle qu'elles sont menées dans le benchmark du NIST TRECVID. Nous discutons de ses données, les tâches, les résultats, et les nombreuses initiatives communautaires dérivés dans la création des annotations et des bases de référence pour des expériences reproductibles.
Nous concluons avec notre point de vue sur les défis futurs et opportunités. Lignes directrices pour TRECVID 2011
(Dernière mise à jour: vendredi, 13-Jan-2012 11:22:50 CEST)
[pic]
0. Table des matières:
• Introduction • Les données vidéo • Accords de données traitées par l'utilisation du NIST • Tâche - indexation sémantique (NAS) • Tâche - Su-élément de la recherche (KIS) • Tâche -