Rövid tájékoztatás a három magyar helyesírási fejlesztésről

Helyesírás szabályai + egyéb nyelvészeti dolgok

Összefoglaló

1. és 2. ----------------

A WinEdt-hez és az aspell-hez egyszerűen szavak listája kell. (Tudtommal a WinEdt csak Windows, az aspell csak UNIX-szerű operációs rendszerek alatt fut.) A szólista fejlesztéséhez kiváló hely lenne a SourceForge-on Müller Keve által létrehozott projekt, ahová érdemes lenne mindenkinek feliratkoznia aki a szólistát fejleszteni szeretné. Keve tudja fel tud oda venni bárkit.

(A SourceForge egy olyan honlap ahol sokféle fejlesztés kap helyet, és ehhez kényelmes eszközök állnak rendelkezésre. Például van fejlesztők számára levelezési lista, felhasználók számára fórum.)

Honlapcímek:
http://www.typotex.hu/texmakro.html Magyar WinEdt + szólista
http://sourceforge.net/projects/wordlist-hu szólista + magyar aspell

3. --------------------

A MySpell és az Ispell szótövekből építkezik, amelyek különböző listákba kerülnek (melléknév...) és a számára megadott szótövek sokszorosát (rengeteg ragozott alakot) képes felismerni. (Az Ispell csak UNIX-szerű operációs rendszerek (pl. Linux) alatt fut, a MySpell viszont Windows alatt is.) Ez a fejlesztés azért hasznos, mert több nyílt forráskódú program (OpenOffice, Abiword) a Word helyesírásellenőrzőjéhez hasonlóan tudja a MySpellt illetve Ispellt használni. Előnye az is, hogy témakörök szerint csoportosított szógyűjteményt is tud kezelni. (Akinek kell, az belerakja a matematika szakszavait, aki nem akarja, nem.)

Honlapcím:

http://www.szofi.hu/gnu/magyarispell Magyar MySpell/Ispell + ennek használata programokban (pl. emacs, vim!)


Elképzelés az együttműködésre

Az elképzelésem az, hogy a wordist-hu oldalon kellene a szólistát fejleszteni, és Gyöngyi helyett Kevénél kellene erre jelentkezni, és a további teendőket az ottani levelezőlistán megvitatni.

A MySpell fejlesztésbe azoknak érdemes bekapcsolódni, akik azt a programot használják. Ennek is nagy segítség a készülő bővülő szólista a wordlist-hu oldalon. (Én -- ha lesz időm -- inkább ehhez csatlakozom majd, ez nekem jobban tetszik. Hogy miért? Lásd lejjebb.) Ennek is van levelezőlistája.

Németh László észrevételei:
az Ispell/MySpell rendelkezik affix tömörítési lehetőséggel, és
kiterjedt ragozási
táblázatok használatát teszi lehetővé, szemben az Aspell-lel.
Gyakorlatilag ez a következőt jelenti: míg az Aspellben legfeljebb pár
millió, addig
az Ispell/MySpell esetén akár többmilliárdos nagyságrendű a felismert
alakok száma.
(Durva felülbecslés: jelenleg a Magyar Ispell affix tábla 10000
bejegyzést tartalmaz,
a szókincs 200000 (ebben részben generált alakok vannak), az annyi mint
2000000000, vagyis kétmilliárd alak.) Az Aspell-t emiatt alkalmatlannak
tartom
magyar nyelvű szövegek helyesírás-ellenőrzésére. (Az újabb Aspell már
beolvasztja
az Ispell-kompatibilis pspell függvénykönyvtárt, így arra ez nem
vonatkozik.)
Ami miatt az Aspell-nek van létjogosultsága, hogy az angol nyelvű
fonetikai információk
felhasználásával kiemelkedően jó javaslatokat tesz - angol helyesírási
hibákra!

Legszerencsésebb az volna, ha valaki csinálna a MySpell-hez egy
karakteres felületet,
vagy egy jegyzettömböt, ami felhasználja a MySpell-t.

A MySpell lefordul Windows alatt is.
Ha valaki kedvet érez ehhez:
http://www.szofi.hu/gnu/magyarispell/myspellhu-0.1.tar.gz
(WinZIP is kicsomagolja).

Egy érdekes tapasztalat az ispellel: az elkészíttethetünk szó egy elírását (elklészíttethetünk) megtalálta és helyes javaslatot adott. Hány alakját kell egy szónak tárolni ahhoz kevésbé intelligens programnál, hogy ilyen bonyolult alakot felismerni képes legyen?

Észrevételek küldhetők: Horváth Árpádnak horvath.arpad at roik.bmf.hu címre.