Folytatódik a szinonimaszótár fejlesztése

Poet•  2013. március 3. 13:34

Az utóbbi hetekben 26 797 szinonimapárt gyűjtöttünk össze a segítségetekkel. A szinonimaszótár készítésének első fázisa lezárult. A kapott adatokat most feldolgozzuk, és eddigi segítőinknek hamarosan bemutatjuk munkájuk eredményét. A második fázisban a szótár további bővítése mellett az adatok átnézése, csoportosítása és javítása kerül sorra.

Ezúton is köszönjük a szinonimaszótár fejlesztésében nyújtott segítségeteket, különös tekintettel a legaktívabb segítőinknek:

  1. CPE (3866)
  2. 1968 (3566)
  3. GKinga (3441)
  4. Schmidt_Aladar (1938)
  5. Aphrodite77 (1784)
  6. Pera76 (1340)
  7. doom (1306)
  8. CriticalGirl (1262)
  9. Vadongyermeke (1073)
  10. Rayna (836)

Hozzászólás írásához be kell jelentkezned!

GKinga2013. március 25. 22:50

Kedves Poet!
Történetesen a pakurár szó talán nem annyira elterjedt az itteni magyar szókincsben, de történelminek nem mondanám.
A többi szép magyar szót szívbôl sajnálom, azért nem írom be még egyszer ôket, hogy újból törölve legyenek. A porbafi*gó, seg*dugasz (kiírni ide nem engedi, milyen érdekes...), és hasonló szavakkal szemben én ezeket sokkal inkább értékelni tudom, és elônyben részesítem, nem mellesleg ez itt egy költészet oldal lenne, ahova a versíráshoz is fel lehet használni, nem mindennapi szavakat is.
Mindent egybevetve mérlegeltem a dolgokat, és úgy döntöttem jelenleg nem folytatom a szótár bôvítését. Azért nektek jó munkát hozzá. Üdv: Kinga

Poet2013. március 25. 16:23

Kedves Kinga!

Az adatbázis átkonvertálásakor technikai okokból sajnos előfordulhatott, hogy egyes szavak elvesztek, ugyanakkor az ezentúl hozzáadott szavakkal már nem történhet ilyen galiba. A kellemetlenségért elnézésedet kérem.

Az általad említett szavakat ugyanakkor én magam nem ismerem. A ''pakurár''-ra rákeresve alig van találat, és egy szótár kivételével ott is szinte mind vezetéknévként szerepel. A szinonimaszótár használhatóságának megóvása érdekében nem szeretnénk olyan szavakat szerepeltetni benne, amiket napjainkban már senki sem használ, és csak történeti jelentőségük van. Köszönöm megértésedet.

GKinga2013. március 25. 16:04

pakurár, polyán, zsendice - mi a baj ezekkel a szép régies magyar szavakkal, hogy kivettétek ôket??

GKinga2013. március 25. 16:00

Kedves Poet,
A leírás alapján nagyon jól rendszereztétek a szótár mµködési alapjait, ugyan még csak a szinonima keresésnél tartok, jáva alatt még nem próbáltam ki.
Rákerestem néhány szóra, amiket bevittem, és meglepôdve tapasztaltam, hogy jónéhány eltµnt. Voltak köztük kevésbé ismeretlen szavak, de például, a televény szó miért lett kivéve? Szép magyar szó pedig.
A teljes eddigi szótárt nem lehet megtekinteni? Üdvözlet, Kinga

Poet2013. március 25. 15:43

Elkészült a szinonimaszótár felülete. Jelenleg a 10 legtöbbet segítő tagunk és moderátoraink kaptak elérést a rendszerhez, de egy rövid teszt időszak után mindenki számára publikus lesz a szótár.

Poet2013. március 23. 11:15

Kedves Kinga!

A szinonimaszótáron már az utolsó simításokat végezzük, hamarosan elérhető lesz. Nem a szétválogatáson dolgozunk, hanem a kezelői felület és a design készítése húzódott el.

GKinga2013. március 23. 11:13

Kedves Poet,
Hol tart a szinonimaszótár? Ilyen hosszadalmas a szétválogatása? Mondjuk, ezen nincs is mit csodálkozni, csak hát, én javasoltam már elôbb, hogy ne vegyesen tegyük fel ôket, hanem valamilyen szempont alapján válogatva.

Törölt tag2013. március 7. 19:56

Törölt hozzászólás.

GKinga2013. március 7. 10:08

Na hát, sokkal több szócsoportra számítottam, ez azt jelenti, hogy átlagosan egy szónak hat szinonimája van.

Poet2013. március 6. 17:55

Elkészült az átkonvertálás. A kész adatbázisban 14 449 szó került be, 2679 szócsoportba rendezve.

Kedves Kinga!

A szavak természetesen szócsoportba lesznek rendezve jelentés szerint is, így a különböző értelmezések nem fognak egymás mellett szerepelni.

GKinga2013. március 6. 14:46

Kedves Poet,
Ez jó hír, és nem tudom, hogy tervezitek, de esetleg a már meglévô szavak, szócsoportok abc sorrendben lesznek fellelhetôek? Mármint azok a szavak, amiknek a szinonimái meg vannak adva, nyilván a szinonimákat nem lehet abc sorrendbe állítani.
Igaz amit mondasz kedves Poet, ezzel én is szembesültem, hogy egy szónak ha kétféle jelentése van, de csak árnyalatban is mást-mást jelenthet, és mindkettônek megadom a szinonimáit, a kétféle értelmezésµ szinonimáknak egymáshoz semmi közük nem lesz, tehát egy szóból eljut az ember egy teljesen más jelentésig.Talán érdemes hosszútávon egy olyan megoldást alkalmazni, hogy a szótárban legyen egy elsôdleges jelentés, a szó konkrét, közeli jelentése, meg másodlagos jelentései, illetve, amennyiben van egy szavunk, és kétféle elsôdleges jelentése is van, ahhoz oda írhatnánk zárójelben, hogy pl. fog (fônév), meg fog (ige).

Poet2013. március 5. 21:59

Valószínűleg sikerült megoldás találni a problémára, és holnapra készen lesz az átkonvertálás. Ezután még el kell készülnie az új felületnek, és indulhat a második kör. :)

Poet2013. március 5. 08:41

Kedves Kinga!

Sajnos pontos időt nem tudok mondani, mert a kategorizálás problémája nagyobb, mint amilyennek gondoltuk. Azt hittük, hogy jól elkülöníthető szócsoportokat fognak alkotni a kapott szavak, de mint kiderült, szinte bármelyik szótól el lehet jutni bármelyik másikig, részben a többjelentésű, részben a tévesen megadott szavak miatt, és emiatt a szócsoportok kialakítása nem egyértelmű feladat. Jelenleg a különböző algoritmusokat teszteljük, hogy a lehető legjobb megoldást választhassuk. Néhány napig még biztosan el fog tartani.

Schmidt_Aladar2013. március 4. 23:29

...szándékosan értelmetlenségeket küldtek be? jó tréfa:(

GKinga2013. március 4. 19:42

És mikor lesz újra elérhetô a szótár?

Poet2013. március 3. 22:11

Kedves Kinga!

A 6000 pár abból adódott össze, hogy voltak, akik szándékosan értelmetlenségeket küldtek be, voltak, akik nem értették meg a feladatot, és a szó ragozott alakjait adták meg szinonimák helyett, és nagyon sok szónak megkaptuk a szinonimáit különböző toldalékolt formákban is. Olyan szempontból még nem néztük át az adatbázist, hogy a megmaradt szavak valóban szinonimák-e.

GKinga2013. március 3. 22:05

a fakopáncs meg harkály párosítást azért tegyétek be :)) ma hallottam ahogy a szorgos harkályok elkezdtek kopácsolni, a sok más egyéb madárfütty, dal mellett.

GKinga2013. március 3. 22:03

Kedves Poet,
Nagyon soknak tµnik az a hatezer pár szinonima. Biztos, hogy mind rossz volt? Lehettek köztük olyan szavak, amelyek esetleg számotokra is ismeretlenek.
Például a csemergél (én írtam) régies kifejezésµ szó, Fekete István regényeiben is szerepel, és masszírozást, gyúrkodást, izomzat lazítását jelenti.
Ha még megvannak a törölt szavak, azért azt javasolnám, tartsátok meg egy külön listában, hátha találunk idôvel pontosabb, jobb szinonimákat rájuk.

Poet2013. március 3. 18:09

Átfésültük az adatbázist és kiválogattuk a hibásan megadott szavak nagy részét, közel 6000 szinonimapárt törölve. A duplikációk kiszűrése után nagyságrendileg 14 000 egyedi szinonima marad majd a szótárban.