Il concetto che sta alla base di questa tecnica è quello del riconoscimento grafico: la webcam inquadra un'immagine e, grazie a un apposito software, individua se al suo interno è presente un certo simbolo. In caso affermativo, miscela al flusso video della ripresa un modello 3D o, addirittura, un'animazione.
serve una webcam e possibilmente anche un microfono
http://ge.ecomagination.com/smartgrid/# ... ed_reality
guardate il video per avere un'idea più chiara
EDIT
qui un video per rendere ancor meglio l'idea http://www.youtube.com/watch?v=KzYlO-5E ... _embedded#