Автор Гілка: Словник Грінченка на r2u.org.ua (Прочитано 13939 раз)

DalekiyObriy · « : 2010-05-20 05:09:38 »

Це напевне більше зацікавить фахівців-лінгвістів, але може комусь буде цікаво і тут.

На сайті r2u.org.ua додано пошук по «Словарю української мови» Б.Грінченка.

Наразі пошук здійснюється лише по головних українських словах (грубим шрифтом).

Переднє слово буде викладено трішки згодом.

Re. · « **Відповідей #1 :** 2010-05-20 12:42:39 »

Він у типовий пошук входить?

DalekiyObriy · « **Відповідей #2 :** 2010-05-20 17:10:00 »

Цитата: Re. від 2010-05-20 12:42:39

Він у типовий пошук входить?

А якже, але цей словник йде останнім, так що якщо результатів забагато, то він може в результат і не попасти

Re. · « **Відповідей #3 :** 2010-05-20 17:53:04 »

Прикро, а можна якось цю кількість регулювати або збільшити?

DalekiyObriy · « **Відповідей #4 :** 2010-05-20 19:39:26 »

Цитата: Re. від 2010-05-20 17:53:04

Прикро, а можна якось цю кількість регулювати або збільшити?

я міркую над тим, щоб підняти її з 35 до 40, але як правило, якщо забагато результатів, це означає, що запит задано неправильно
щоб зменшити кількість можна:
а) звузити пошук по українських словах (без цитат)
б) обмежити пошук одним словником

noddeat · « **Відповідей #5 :** 2010-05-21 01:47:56 »

а навіщо взагалі це обмеження? економія навантаження на базу даних?

DalekiyObriy · « **Відповідей #6 :** 2010-05-21 17:40:26 »

Цитата: noddeat від 2010-05-21 01:47:56

а навіщо взагалі це обмеження? економія навантаження на базу даних?

1) зменшення навантаження на базу
2) відбивання спроб звантажити базу (любителі були, хоча словники доступні в pdf)
3) економія трафіку (бо без обмеження, наприклад, задавши в пошуку «п*» можна напевне отримати декілька десятків тисяч статей)
4) щоб не перевантажувати сторінку результатів (бо коли видає 25 сторінок значить щось не так з пошуком)

Re. · « **Відповідей #7 :** 2010-05-21 17:59:49 »

Цитата: DalekiyObriy від 2010-05-21 17:40:26

2) відбивання спроб звантажити базу (любителі були, хоча словники доступні в pdf)

Чесно пишучи, мене б самого більше цікавила сама база даних, аніж якийсь там pdf.

До того ж, словників усе дедалі більше, тобто й результатів відповідно. Я нічого поганого не бачу, в тому, що користувач шукає одне слово, яке по тридцять раз трапляється в одному словнику і шукати його по всім одночасно. Звісно, цим не потрібно зловживати, але інколи потрібно. І, звісно, обмеження повинні бути, але не такі маленькі. Я не думаю, що навантаження буде менше, якщо я по кожному словнику буду шукати окремо. Власне, вам видніше, чи сервер це витримає, але це єдине, що мене дратує.

noddeat · « **Відповідей #8 :** 2010-05-21 18:09:09 »

Цитата

4) щоб не перевантажувати сторінку результатів (бо коли видає 25 сторінок значить щось не так з пошуком)

дивний арґумент. власне, розбиття на сторінки й дозволить вирішити всі проблеми пп. 1—4.

взагалі, було б добре, якби крім пошуку, словники можна було переглядати у вигляді списку слів, відсортованого за буквами/складами (як написав Re, pdf — це незручно).

DalekiyObriy · « **Відповідей #9 :** 2010-05-21 23:32:08 »

Цитата: noddeat від 2010-05-21 18:09:09

взагалі, було б добре, якби крім пошуку, словники можна було переглядати у вигляді списку слів, відсортованого за буквами/складами

для словника Криського і сучасного словника така можливість є

DalekiyObriy · « **Відповідей #10 :** 2010-05-22 21:42:53 »

Цитата: Re. від 2010-05-21 17:59:49

Чесно пишучи, мене б самого більше цікавила сама база даних, аніж якийсь там pdf.

а що саме з бази даних цікавить (можна це перенести в приват)? бо я якраз не проти піти на пенсію і віддати це все господарство комусь молодшому з купою енергії, що зробить з проекту нарешті гарну цяцю

Цитата: Re. від 2010-05-21 17:59:49

До того ж, словників усе дедалі більше, тобто й результатів відповідно. Я нічого поганого не бачу, в тому, що користувач шукає одне слово, яке по тридцять раз трапляється в одному словнику і шукати його по всім одночасно. Звісно, цим не потрібно зловживати, але інколи потрібно. І, звісно, обмеження повинні бути, але не такі маленькі. Я не думаю, що навантаження буде менше, якщо я по кожному словнику буду шукати окремо. Власне, вам видніше, чи сервер це витримає, але це єдине, що мене дратує.

я з кожним новим словником межу піднімаю, але окрім того, як правило, аналізую журнал на кількість (і якість) запитів, які в неї впираються... щоправда я давно цього не робив вже, підняв межу до 50, ще подивлюсь на журнал наступні пару днів...

хочу лише додати, що сайт крутиться на віртуальному сервері і там ще схоже декілька десятків інших проектів, так що ресурси (ЦП і ОП) досить обмежені

Re. · « **Відповідей #11 :** 2010-05-23 00:16:11 »

Цитата: DalekiyObriy від 2010-05-22 21:42:53

а що саме з бази даних цікавить (можна це перенести в приват)? бо я якраз не проти піти на пенсію і віддати це все господарство комусь молодшому з купою енергії, що зробить з проекту нарешті гарну цяцю

Дуже сумнівно, що я потягну цей проект (як я розумію, він базується на postgresql, drupal, php тощо, жодного з переліченого я не використовував на промисловому рівні). Якщо Вам таке підходить, то, звичайно, не соромтесь — пишіть у приват.

Щодо бази — це її структура, словом, не Вам же це пояснювати.

DalekiyObriy · « **Відповідей #12 :** 2010-05-23 17:05:45 »

Цитата: Re. від 2010-05-23 00:16:11

Щодо бази — це її структура, словом, не Вам же це пояснювати.

Код: [Вибрати]

\d src
                                         Table "public.src"
    Column    |            Type             |                         Modifiers                          
--------------+-----------------------------+------------------------------------------------------------
 word_id      | integer                     | not null default nextval('src_word_id_seq'::regclass)
 word_str     | character varying           | 
 state        | integer                     | default 0
 word_str_ru  | character varying           | 
 word_str_uk  | character varying           | 
 word_str_rub | character varying           | 
 ts_uk        | tsvector                    | 
 ts_ru        | tsvector                    | 
 last_edit_tm | timestamp without time zone | 
Indexes:
    "src_pkey" PRIMARY KEY, btree (word_id) CLUSTER                                                                                                                        
    "src_state" btree (state)                                                                                                                                              
    "ts_ru_idx" gist (ts_ru)                                                                                                                                                    
    "ts_uk_idx" gist (ts_uk)

Re. · « **Відповідей #13 :** 2010-05-23 20:10:33 »

Ось цього в тому pdf і бракує.

DalekiyObriy · « **Відповідей #14 :** 2010-05-23 21:12:18 »

Цитата: Re. від 2010-05-23 20:10:33

Ось цього в тому pdf і бракує.

дик: pdf2html | html2sql

але я не зовсім розумію навіщо кінцевому користувачеві sql?

а от якщо Ви візьметесь зробити *повноцінний* набір словничків для (q)stardict, то можна про це серйозно поговорити, бо горбуху, яка буде в (q)stardict шукати лише половину слів я робити не хочу, а на справжню роботу часу не вистачає...

Linux.org.ua

Автор Гілка: Словник Грінченка на r2u.org.ua (Прочитано 13939 раз)

DalekiyObriy

Словник Грінченка на r2u.org.ua

Re.

Re: Словник Грінченка на r2u.org.ua

DalekiyObriy

Re: Словник Грінченка на r2u.org.ua

Re.

Re: Словник Грінченка на r2u.org.ua

DalekiyObriy

Re: Словник Грінченка на r2u.org.ua

noddeat

Re: Словник Грінченка на r2u.org.ua

DalekiyObriy

Re: Словник Грінченка на r2u.org.ua

Re.

Re: Словник Грінченка на r2u.org.ua

noddeat

Re: Словник Грінченка на r2u.org.ua

DalekiyObriy

Re: Словник Грінченка на r2u.org.ua

DalekiyObriy

Re: Словник Грінченка на r2u.org.ua

Re.

Re: Словник Грінченка на r2u.org.ua

DalekiyObriy

Re: Словник Грінченка на r2u.org.ua

Re.

Re: Словник Грінченка на r2u.org.ua

DalekiyObriy

Re: Словник Грінченка на r2u.org.ua