Автор Гілка: Словник Грінченка на r2u.org.ua  (Прочитано 11946 раз)

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Це напевне більше зацікавить фахівців-лінгвістів, але може комусь  буде цікаво і тут.

На сайті r2u.org.ua додано пошук по «Словарю української мови» Б.Грінченка.

Наразі пошук здійснюється лише по головних українських словах (грубим шрифтом).

Переднє слово буде викладено трішки згодом.
Fedora 35 (x86-64)

Відсутній Re.

  • Загальний модератор
  • Літератор
  • *****
  • дописів: 1898
  • Карма: +1/-0
Re: Словник Грінченка на r2u.org.ua
« Відповідей #1 : 2010-05-20 12:42:39 »
Він у типовий пошук входить?

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: Словник Грінченка на r2u.org.ua
« Відповідей #2 : 2010-05-20 17:10:00 »
Він у типовий пошук входить?
А якже, але цей словник йде останнім, так що якщо результатів забагато, то він може в результат і не попасти
Fedora 35 (x86-64)

Відсутній Re.

  • Загальний модератор
  • Літератор
  • *****
  • дописів: 1898
  • Карма: +1/-0
Re: Словник Грінченка на r2u.org.ua
« Відповідей #3 : 2010-05-20 17:53:04 »
Прикро, а можна якось цю кількість регулювати або збільшити?
« Змінено: 2010-05-20 17:53:21 від Re. »

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: Словник Грінченка на r2u.org.ua
« Відповідей #4 : 2010-05-20 19:39:26 »
Прикро, а можна якось цю кількість регулювати або збільшити?
я міркую над тим, щоб підняти її з 35 до 40, але як правило, якщо забагато результатів, це означає, що запит задано неправильно
щоб зменшити кількість можна:
а) звузити пошук по українських словах (без цитат)
б) обмежити пошук одним словником
Fedora 35 (x86-64)

Відсутній noddeat

  • Кореспондент
  • ***
  • дописів: 197
  • Карма: +0/-0
Re: Словник Грінченка на r2u.org.ua
« Відповідей #5 : 2010-05-21 01:47:56 »
а навіщо взагалі це обмеження? економія навантаження на базу даних?
Filenames are infinite in length, where infinity is set to to 255 characters. Peter Collinson, "The Unix File System"

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: Словник Грінченка на r2u.org.ua
« Відповідей #6 : 2010-05-21 17:40:26 »
а навіщо взагалі це обмеження? економія навантаження на базу даних?
1) зменшення навантаження на базу
2) відбивання спроб звантажити базу (любителі були, хоча словники доступні в pdf)
3) економія трафіку (бо без обмеження, наприклад, задавши в пошуку «п*» можна напевне отримати декілька десятків тисяч статей)
4) щоб не перевантажувати сторінку результатів (бо коли видає 25 сторінок значить щось не так з пошуком)
Fedora 35 (x86-64)

Відсутній Re.

  • Загальний модератор
  • Літератор
  • *****
  • дописів: 1898
  • Карма: +1/-0
Re: Словник Грінченка на r2u.org.ua
« Відповідей #7 : 2010-05-21 17:59:49 »
2) відбивання спроб звантажити базу (любителі були, хоча словники доступні в pdf)
Чесно пишучи, мене б самого більше цікавила сама база даних, аніж якийсь там pdf.

До того ж, словників усе дедалі більше, тобто й результатів відповідно. Я нічого поганого не бачу, в тому, що користувач шукає одне слово, яке по тридцять раз трапляється в одному словнику і шукати його по всім одночасно. Звісно, цим не потрібно зловживати, але інколи потрібно. І, звісно, обмеження повинні бути, але не такі маленькі. Я не думаю, що навантаження буде менше, якщо я по кожному словнику буду шукати окремо. Власне, вам видніше, чи сервер це витримає, але це єдине, що мене дратує.

Відсутній noddeat

  • Кореспондент
  • ***
  • дописів: 197
  • Карма: +0/-0
Re: Словник Грінченка на r2u.org.ua
« Відповідей #8 : 2010-05-21 18:09:09 »
Цитата
4) щоб не перевантажувати сторінку результатів (бо коли видає 25 сторінок значить щось не так з пошуком)
дивний арґумент. власне, розбиття на сторінки й дозволить вирішити всі проблеми пп. 1—4.

взагалі, було б добре, якби крім пошуку, словники можна було переглядати у вигляді списку слів, відсортованого за буквами/складами (як написав Re, pdf — це незручно).
Filenames are infinite in length, where infinity is set to to 255 characters. Peter Collinson, "The Unix File System"

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: Словник Грінченка на r2u.org.ua
« Відповідей #9 : 2010-05-21 23:32:08 »
взагалі, було б добре, якби крім пошуку, словники можна було переглядати у вигляді списку слів, відсортованого за буквами/складами
для словника Криського і сучасного словника така можливість є
Fedora 35 (x86-64)

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: Словник Грінченка на r2u.org.ua
« Відповідей #10 : 2010-05-22 21:42:53 »
Чесно пишучи, мене б самого більше цікавила сама база даних, аніж якийсь там pdf.
а що саме з бази даних цікавить (можна це перенести в приват)? бо я якраз не проти піти на пенсію і віддати це все господарство комусь молодшому з купою енергії, що зробить з проекту нарешті гарну цяцю ;)

До того ж, словників усе дедалі більше, тобто й результатів відповідно. Я нічого поганого не бачу, в тому, що користувач шукає одне слово, яке по тридцять раз трапляється в одному словнику і шукати його по всім одночасно. Звісно, цим не потрібно зловживати, але інколи потрібно. І, звісно, обмеження повинні бути, але не такі маленькі. Я не думаю, що навантаження буде менше, якщо я по кожному словнику буду шукати окремо. Власне, вам видніше, чи сервер це витримає, але це єдине, що мене дратує.
я з кожним новим словником межу піднімаю, але окрім того, як правило, аналізую журнал на кількість (і якість) запитів, які в неї впираються... щоправда я давно цього не робив вже, підняв межу до 50, ще подивлюсь на журнал наступні пару днів...

хочу лише додати, що сайт крутиться на віртуальному сервері і там ще схоже декілька десятків інших проектів, так що ресурси (ЦП і ОП) досить обмежені
Fedora 35 (x86-64)

Відсутній Re.

  • Загальний модератор
  • Літератор
  • *****
  • дописів: 1898
  • Карма: +1/-0
Re: Словник Грінченка на r2u.org.ua
« Відповідей #11 : 2010-05-23 00:16:11 »
а що саме з бази даних цікавить (можна це перенести в приват)? бо я якраз не проти піти на пенсію і віддати це все господарство комусь молодшому з купою енергії, що зробить з проекту нарешті гарну цяцю ;)
Дуже сумнівно, що я потягну цей проект (як я розумію, він базується на postgresql, drupal, php тощо, жодного з переліченого я не використовував на промисловому рівні). Якщо Вам таке підходить, то, звичайно, не соромтесь — пишіть у приват.

Щодо бази — це її структура, словом, не Вам же це пояснювати. ;)
« Змінено: 2010-05-23 00:20:50 від Re. »

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: Словник Грінченка на r2u.org.ua
« Відповідей #12 : 2010-05-23 17:05:45 »
Щодо бази — це її структура, словом, не Вам же це пояснювати. ;)
\d src
                                         Table "public.src"
    Column    |            Type             |                         Modifiers                          
--------------+-----------------------------+------------------------------------------------------------
 word_id      | integer                     | not null default nextval('src_word_id_seq'::regclass)
 word_str     | character varying           |
 state        | integer                     | default 0
 word_str_ru  | character varying           |
 word_str_uk  | character varying           |
 word_str_rub | character varying           |
 ts_uk        | tsvector                    |
 ts_ru        | tsvector                    |
 last_edit_tm | timestamp without time zone |
Indexes:
    "src_pkey" PRIMARY KEY, btree (word_id) CLUSTER                                                                                                                        
    "src_state" btree (state)                                                                                                                                              
    "ts_ru_idx" gist (ts_ru)                                                                                                                                                    
    "ts_uk_idx" gist (ts_uk)                                                                                                                                                    
Fedora 35 (x86-64)

Відсутній Re.

  • Загальний модератор
  • Літератор
  • *****
  • дописів: 1898
  • Карма: +1/-0
Re: Словник Грінченка на r2u.org.ua
« Відповідей #13 : 2010-05-23 20:10:33 »
Ось цього в тому pdf і бракує.

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: Словник Грінченка на r2u.org.ua
« Відповідей #14 : 2010-05-23 21:12:18 »
Ось цього в тому pdf і бракує.
дик: pdf2html  | html2sql :)
але я не зовсім розумію навіщо кінцевому користувачеві sql?

а от якщо Ви візьметесь зробити *повноцінний* набір словничків для (q)stardict, то можна про це серйозно поговорити, бо горбуху, яка буде в (q)stardict шукати лише половину слів я робити не хочу, а на справжню роботу часу не вистачає...
Fedora 35 (x86-64)