Hungarian stop words

A magyar stop words lista egyszerűen csak egy gyűjtés, mert szükségem volt SEO kapcsán egy magyar “stop words” állományra és a neten egy nagyobb, teljes anyagot nem találtam, így összegyűjtöttem magam. kerestem “magyar stop words”, “magyar stop szavak”, “stopwords” stb… vonalon, nem hozott megfelelő eredményt.

Papp Gábor is írt ezzel kapcsolatban egy cikket, hogy mire lehet használni (SEO, Website Auditor – TF-IDF elemzés), érdemes elolvasni: Magyar STOP words lista

Benne van a korábbi cikkben ( Keyword Statistics – wordpress plugin ) említett “stopwords.js” tartalma is.

közel 300 stop words – magyarul

a
az
egy
be
ki
le
fel
meg
el
át
rá
ide
oda
szét
össze
vissza
de
hát
és
vagy
hogy
van
lesz
volt
csak
nem
igen
mint
én
te
õ
mi
ti
õk
ön
ide 	
volt 	
ő
ők
ahogy
ahol
aki
akik
akkor
alatt
által
Általában
amely
amelyek
amelyekben
amelyeket
amelyet
amelynek
ami
amit
amolyan
amíg
amikor
abban
ahhoz
annak
arra
arról
azok
azon
azt
azzal
azért
aztán
azután
azonban
bár
belül
benne
cikk
cikkek
cikkeket
e
eddig
egész
egyes
egyetlen
egyéb
egyik
egyre
ekkor
elég
ellen
elő
először
előtt
első
éppen
ebben
ehhez
emilyen
ennek
erre
ez
ezt
ezek
ezen
ezzel
ezért
felé
hanem
hiszen
hogyan
így
illetve
ill.
ill
ilyen
ilyenkor
ison
ismét
itt
jó
jól
jobban
kell
kellett
keresztül
keressünk
kívül
között
közül
legalább
lehet
lehetett
legyen
lenne
lenni
lett
maga
magát
majd
már
más
másik
még
mellett
mert
mely
melyek
mit
míg
miért
milyen
mikor
minden
mindent
mindenki
mindig
mintha
mivel
most
nagy
nagyobb
nagyon
ne
néha
nekem
neki
néhány
nélkül
nincs
olyan
ott
őket
pedig
persze
s
saját
sem
semmi
sok
sokat
sokkal
számára
szemben
szerint
szinte
talán
tehát
teljes
tovább
továbbá
több
úgy
ugyanis
új
újabb
újra
után
utána
utolsó
vagyis
valaki
valami
valamint
való
vagyok
vannak
voltam
voltak
voltunk
vele
viszont
volna
alá
ha
is
ad
2010
szerző
helyett
amúgy
főleg
os
es
szerintem
oka
hozzászólás
soha
hozzászólások
száma
kategória
feladva
komment
szia
hello
üdv
szeretettel
köszönöm
köszönjük
mindneki
mindenkinek
mindenkit
akár
azok
azoknak
magunk
magunkat
magunkra
magunkkal
veletek
velük
sajnos
magam
külön
lesz
felett
alatt
mellett
egyszerre
helló
ember
hol
velem
közepette
pont
esetleg
rólam
rólunk
pici
picivel
sziasztok
rám
rajtam
mind
http
www
köszi
kis
igy
szó
akit
evvel
bele
tőle
tőlem
tőlünk
tőletek
tőlük
com
valamit
valaminek
valamiért
jogi nyilatkozat
copyright
minden jog fenntartva
ászf
rss
impresszum

Használjátok belátásotok szerint. :)

Megjegyzés: a duplikátumok kiszűréséhez a Remove Duplicate Lines from Text site-t használtam, tényleg jó, merem ajánlani.

Hungarian stop words

9 HOZZÁSZÓLÁS

  1. Nekem tegnap pl. egy olyan dolog miatt kellett, hogy SEO kapcsán szerettem volna a stop words szavakat megszűrve vizsgálni szövegstatokat.

    Vagy pl. a belinkelt cikk wp pluginjéhez is felhasználható.

  2. Nekem nem tűnt fel, hogy bármilyen hátránya lenne ezen szavak használatának. Egy cím, url vagy leírás akkor válik emberek számára értelmessé, ha ezeket is tartalmazza a szöveg. A Google pedig mindig is azt mondta, hogy embereknek és ne robotoknak írjunk. Én ehhez tartom magam :)

  3. Gábor, írtam én valahol hogy ezeket ne használják a szövegezéskor? :P
    Így írtam: csak egy vizsgálat miatt kellett, ennyi .. :) Mivel anno is téma volt egy másik bejegyzés kapcsán, most kiegészítve tettem ki a listát.

    Az embereknek kell írni szerintem is a szöveget, max odafigyelni arra, hogy ha lehet, az barátságos legyen a google számára is.

  4. Nem írtad, nem is értettem félre. Talán kissé eltértem a tárgytól, vagy inkább túl általánosan tekintek rá.

    Én már szinte teljesen figyelmen kívül hagyom a Google-t, mivel az is egyre inkább fejlődik, és megérti a szöveget. Már nem bajlódom kulcsszavakkal, ami eszembe jut, azt írom le.

    Szerintem az on-site seo már nagyon értelmét vesztette. Persze vannak még fontos dolgok, mint a belső linkek, meg a könnyű indexelhetőség, de már láttam nagyon rosszul optimizált oldalt elől a találati listán. Szerintem a klasszikus seo meghalt, vagy haldoklik, főleg mióta már a szociális hálózatok egyre nagyobb hangsúlyt kapnak.

    Szóval nem kulcsszavazok, nem cserélgetek linkeket, nem katalógusozok. Szerintem a stop szavakból is mítosz lesz lassan.

  5. Ezek nekem gyűltek, most hogy elkezdtem használni a Tieid;)

    szerintem, szerint, oka, akar, hozzászólás, soha, hozzászólások, akar, száma, kategória, feladva, megjelent, megjelenik, komment, kommentelt, szia, hello, üdv

  6. Gábor, nem értek veled egyet, de nem szeretnélek győzködni ebben a témában. :)

    Prof, köszi a gyűjtést, kiegészítettem vele a listát!

  7. na még egy adag ;)

    szeretettel, köszönöm, köszönjük, mindneki, mindenkinek, mindenkit, akár, azok, azoknak, magunk, magunkat, magunkra, magunkkal, veletek, velük, sajnos, magam, külön, lesz, felett, alatt, mellett, emberek, egyszerre, helló, ember, hol, velem, közepette, pont, esetleg, rólam, rólunk, pici, picivel, sziasztok, rám, rajtam, mind, http, www, köszi, kis, igy, szó, akit, evvel, bele, tőle, tőlem, tőlünk, tőletek, tőlük, com, valamit, valaminek, valamiért

    lehet majd küldöm a scriptet is ami tudja használni… már egész szépen kulcsszavaz:)

  8. Köszi, azt hiszem ezt szinte a “végtelenségig” lehet majd így gyűjteni, jöhetnek :)

    Ha megvan a gyűjtő script, azt is szívesen kitenném a lapra, köszi!

HOZZÁSZÓLOK A CIKKHEZ

Kérjük, írja be véleményét!
írja be ide nevét