Címkézés (Tag) 2.0
Eljött a web 2.0, de a címkézésen lehetne még mit fejleszteni.
Nagyon jó dolog ez a “taggelés” ez nagyban hozzájárul, hogy a felhasználók építsék a tartalmat, nincsenek kötött kategóriák és végeláthatatlan fa szerkezetű besorolások, hanem csak beírjuk, hogy “web, autó, akarmi” és kész.
Az utóbbi időben elég sok oldalt látogattam, egy saját projektfejlesztés miatt. Szinte mindenhol azt vettem észre, hogy a taggelésen nem nagyon gondolkodtak, én 2 problémába is belefutottam amit még nem láttam megvalósítva. Ezek a következők:
- tagek összevonása (web2, web 2.0, web20, stb.)
- tagek fordítása (car = autó, error = hiba, stb.)
Nézzük sorban, az első esetben az a probléma, hogy a felhasználóknak meg kellene adni azt a lehetőséget, hogy összekapcsolják a tageket. Azaz fogjuk a leggyakrabban használt taget és a többit amit hozzá csatolunk az mintegy “alias” működne. Itt ugyanaz a gond mint a google esetében a www. és www. nélküli webcímeknél az egy helyre tartozó tartalom szétoszlik.
A második esetben, pl. nézzük meg a digg-et, már a 3. verziónál jár a fejlesztők helyében én nem adtam volna esélyt a klónoknak: internetmedia, linkter, book.mark.hu. Lehetőség kellene a különböző nyelvi verziók elkészítésére, ezáltal mindenki náluk diggelne, talán majd a v5-ben :).
A probléma az, hogy a különböző nyelvű tageket hogyan rendszerezzük. Egy helyen legyen minden vagy szétbontva nyelvekre? Arra gondolok, hogy valaki felvisz egy linket ad neki egy “car” taget és én felviszek egy másik linket “autó” taggel. A szép az lenne ha a sima (vagy kiemelt) felhasználók ezt összekapcsolnák.
Felmerül még egy harmadik dolog is de ez nem biztos, hogy a címkézéshez tartozik. Azaz a beküldött tartalmak nyelv szerinti szétbontása, erre egy speciális “nyelvi címke”-t csinálnék ahová bekerülnének az ország ISO kódok.
A digg-re egyébként a 2. magyar nyelvű (itt az első) postolt linkem után jött is egy comment, hogy ide leginkább angol nyelvű tartalmak jönnek és fogalma sincs mi az amit küldtem.
Kiváncsian várom a véleményeket!
zsolti
# 2006. július 29., szombat - 00:32 · válasz erre
Én még ott vagyok lemaradva, hogy hogy töröljem a kapcsolódó címkéket, amikor egy post törlésre kerül? Tehát ha ugye az adatbázis egyik táblájában fel vannak véve a címkék, valamint van egy másik (kapcsoló)tábla, amiben fel vannak véve a címkeID+postID-k, akkor miképp töröljem a címkék táblából azt, amihez már nem tartozik egy post sem. Á, leírni is nehéz. Kicsit bonyolult, de gondolom érted.
Nincs erra valami szebb módszer, mint minden az, hogy a post törlésnél megnézni, hogy a bizonyos címkéjéhez tartoznak-e még postok, és ha nem, akkor a törölje a címkét is a postal egyetemben?
Benjamin
# 2006. július 29., szombat - 00:40 · válasz erre
Post torles utan 1 SQL-el tudod kerdezni a tag es a kapcsolotablat joinolva, hogy mely tagekhez nem tartozik mar post (ezt 1 SQL -el torolheted is).
Ámon Tamás
# 2006. augusztus 16., szerda - 07:06 · válasz erre
A drupal tud olyat (de a del.icio.us is pld.), hogy megjeleníti az eddigi tag-jeidet, tehát nem lesz két azonos értelmű, mondjuk ez szerkesztői probléma is.
A nyelvnél pedig a különböző nyelvü cikkeknél különböző nyelvű tag-eket kell felvenni.
A digg az valószínüleg tényleg hülye ilyen szempontból.
Benjamin
# 2006. augusztus 16., szerda - 07:16 · válasz erre
De itt nem egy felhasznalo tagjeirol van szo, hanem a sok-sok user tagjerol pl: web2 web2.0 web2.0_2006 web20 web2_0
A nyelveknel 2 dolog van, a tartalomra vonatkozo speci nyelvi cimke jeloles (hu, en, de, stb.) a masik h. a tartalomhoz tartozo cimkek: car, mustang, stb. akkor is elerhetoek legyenek ha en az “autó” tagre kattintok, maximum megjelenik a tartalom mellett h. ez bizony angol oldal.
Baranyai Laszlo
# 2006. augusztus 16., szerda - 09:15 · válasz erre
Szerintem mivel ez nem elsősorban informatikai probléma, ne is az informatikában keressük a megoldást. A könyvtárosok régóta ismernek olyat pl. hogy egyetemes tizedes osztályozás. Ez egyfajta szótár, ahol a témakörök leíró szavai kódokat kapnak. Ha lenne egy olyan adatbázis, ami ezeket a címke hozzárendeléseket tartalmazza, onnan kezdve mindegy, hogy “auto” vagy “car”, az adatbázisból kikeressük a 99.1234.99 kódhoz tartozó cikkeket. A felhasználónak is jobb lenne, mert egy kis szótár boxban kikereshetné a neki megfelelőeket, vagy a témakörhöz javasolhatna újakat.
Galiba Péter
# 2006. augusztus 16., szerda - 10:49 · válasz erre
Szerintem ez egy tényleg bonyolult dolog. A cég oldalan amin / akiknek dolgozok szintén nagy problémát okoz ez, mivel a szabad cimkézést nehéz szűrni, és főleg utólag szabályozni. A másik dolog, hogyha nincsnenek szerkesztők, vagy nagyon kevés van, akkor az istennek se lehet a régieket összevonni, vagy átcsoportosítani.
Mondok egy pár példát: United Nations, U.N., UN ezeket egy automatizmus iszonyú befektetések árán tudja csak egymással azonosnak tekinteni, de ez csak a jéghegy csúcsa. Vannak ennél sokkal elburjánzottabb tagek is. Ezen kívul jó lenne szűrni azokat a tageket amik egy helyszínre vonatkoznak, azaz meg kellene jelölni hogy ezek helyszínek.
Ha már utólagos feldolgozásról beszélünk, csak a tesztszerverünkön 10 ezer tag van, és minden valószínűség szerint az élőn ennek akár többtízszerese. Ennek a feldolgozása szűrése egyesítése is hónapokat vehet igénybe, hozzátéve azt, hogy több mint 90 000 tartalmi oldal van az éles szerveren, míg a tesztszerveren kb 10 ezer. Kicsiben viszonylag könnyű tud lenni, de ilyen méretek esetén a dolgok kezdenek eldurvulni.
A másik dolog, hogy a felhasználónak kényelmesen kell tudni felvinni a tartalmat, főleg ha már nem pénzért csinálja, és ne kelljen neki egy 10 ezres cimkefelhőből kiválogatnia azokat amik érvényesek a tartalmára.
Benjamin
# 2006. augusztus 22., kedd - 17:14 · válasz erre
Baranyai Laszlo: kifejtened bovebben? Sztem a felhasznalok nem akarnak “kodokat” tanulni, megjegyezni, stb.
Galiba Péter: en sem automatizmusra gondoltam, az mar akar MI is lehetne :) azt meg azert ne kelljen webre irni, majd a google-nal irnak :)
Kicsit sokank tunnek nekem azok a tagek amiket emlitesz, lehet tudni h. milyen oldalrol van szo? (akar maganba kivancsi lennek)
Egyebkent az jutott eszembe h. a tagek megadasakor egy olyasmi JS-t lehetne hasznalni mint a google suggest. Tehat beiras kozben kiadna a mar meglevo tageket igy szerintem elkerulheto lenne h. pl. a “web2.0″-t 5-6 felekepp irjak be.
Talan meg azt is ki lehetne probalni h. a tageket “angolositva” tarolni es melle vmi soundexet hasznalva a szerkesztok munkajat konnyitve “kiadni” az esetleges egyezoseget. Ez nemtudom mennyire mukodhet. Probalkozott mar vki ilyennel?
Baranyai Laszlo
# 2006. augusztus 22., kedd - 21:02 · válasz erre
Én arra gondoltam, hogy pl. ez egy tipikus AJAX feladatnak nez ki. Adott egy szótár adatbázis, amely a beírt címszavakat tartalmazza témakörök szerinti besorolással. A blog bejegyzés írásakor megadok egy tag listát, amit az AJAX feldolgoz és rögzíti a kódokat hidden input mezőkben. Nem is várnám el a látogatóktól, hogy ilyen kódokat megjegyezzenek. További előnye, hogy a témakör ismeretében lehet automatikusan a cikkhez illő címkéket javasolni a szerzőnek. Pl. legyen a címkém “autó”, ezt a program rögzítheti és egyben újabbakat javasolhat (top 20): “közlekedés”, “fiat”, “mercedes”, “trabant”, stb. Tulajdonképp olyan, mint a google suggest, de irányított gráf kapcsolatokkal.
Én már belefutottam ilyen fejlesztési projektbe, ahol szabadon adhattak meg kulcsszavakat minden bejegyzéshez. A gyűjtőlistáknál a bejegyzés fő témaköre volt a csoportosítás alapja, de a kuszaságot látva a megrendelő inkább mégsem kérte.
Benjamin
# 2006. augusztus 22., kedd - 21:58 · válasz erre
Az altalad emlitett “kodokat” es tageket ki fogja osszerendelni? Ehhez is kell akkor valami “szerkesztosegi” adminisztracio, nem?
Egyebkent en is az AJAX-os dolog fele hajlok leginkabb, hisz ha gepeles kozben latja a felhasznalo a kulcsszavakat es ott megtalalja azt ami neki kell akkor nyilvan hasznalni fogja es nem irja be maskepp.
Vegulis annyi kell, hogy meghatarozzuk a tag separatort (, - vesszo) es minden vesszo utan gepelt szot elkezdunk keresni es kiadni a usernek.
Mondjuk azert vannak felhasznalok akik gepeles kozben a billentyuzetet nezik es esetleg nem veszik eszre a feldobott tageket!
Ezt a grafos megoldast egy kicsit soknak talalnam ide, hisz pl: az auto melle feldobhata akar 100-as nagysagrendu listat is.
Baranyai Laszlo
# 2006. augusztus 23., szerda - 20:08 · válasz erre
Igen, az elején biztosan kellene adminisztráció, hisz kell egy adatbázis. Ha teljesen web2.0 alapon képzeljük el és a közösség bölcsessége kell felépítse, akkor a tagok jöhetnének pl. a Wikipedia projektből. Amúgy nem véletlen írtam a könyvtáros listáról. Nem kötelező használni, de luxus újra felfedezni a spanyolviaszt.
Az autó példánál direkt írtam a top 20-at. Hosszabb listának semmi értelme, max lehetne lapozni ha valaki kutakodni akar.
create.myApp
# 2006. augusztus 27., vasárnap - 11:05 · válasz erre
Én is ezen a problemán filóztam mostanában (hogy mennyire spanyolviasz, nem tudom, de eddig nem sok helyen találkoztam a cimkézés kiterjesztett lehetőségeivel… tehát a gyakorlatba nem ment át. Én is írtam róla: Kiterjesztett cimkehasználat
Benjamin
# 2006. augusztus 27., vasárnap - 11:15 · válasz erre
Elolvastam az irasodat, vmi hasonlo dolgok fogalmazodtak meg bennem is, esetleg beszelnunk kellene emailben vagy ICQ-n! :)
create.myApp
# 2006. augusztus 27., vasárnap - 12:16 · válasz erre
Az e-mail címemet már ismered (ha minden igaz), msn: programozo@mail.by - ICQzni nem nagyon szoktam.