A versek rímeit, ritmusait és más rejtett tulajdonságait feltáró, szabad hozzáférésű adatbázis forrása a Magyar Elektronikus Könyvtár számos, szerzői jogi védelem alatt már nem álló gyűjteménye – olvasható az ELTE honlapján közölt cikkben.
A korpusznyelvészet összegyűjti az adott nyelvterületről a szövegeket, különféle szempontok alapján annotálja, vagyis felcímkézi azokat, majd a nyelvi jellemzők közötti keresések révén tár fel összefüggéseket.
A szavak grammatikai tulajdonságainak azonosítására a kutatók a Nyelvtudományi Intézetben fejlesztett e-magyar programot használták fel, amellyel automatikusan meghatározható az adott kifejezés szótári alakja, szófaja, továbbá morfológiai jellemzői – számol be a cikkben Palkó Gábor, az ELTE Digitális Bölcsészet Tanszék egyetemi docense.
Mint a cikkben olvasható, a mintázatok feltárása szempontjából még érdekesebb, hogy létrehozhatók úgynevezett gyakorisági listák is. Így néhány kattintással egy csokorba gyűjthető, hogy költőink milyen főneveket használtak a leggyakrabban, hogy az idők során hogyan változott a jelen és múlt idejű igék aránya, a megszólítás vagy épp a második személyű igealakok használati gyakorisága.
A versek rímképlet, a szavak hangrend vagy szótagszám szerint is listázhatók, a verseknél pedig a felhasználók láthatják a sorok szótagszámát és időmértékes ritmusképletét is.
A Verskorpuszt elsősorban kutatóknak és egyetemi hallgatóknak ajánlják a készítők, de, mint írják, jó szolgálatot tehet a pedagógusoknak a középiskolai irodalomórákat, verselemzéseket támogató adatbázisként is.
A szabad hozzáférésű adatbázist - verskorpusz.elte-dh.hu - folyamatosan bővítik, legközelebb várhatóan Juhász Gyula és Radnóti Miklós költeményei kerülnek sorra.