Автор Гілка: Великі документи  (Прочитано 4583 раз)

Відсутній piktor

  • Видавець
  • *******
  • дописів: 3396
  • Карма: +0/-0
Re: Великі документи
« Відповідей #15 : 2010-01-27 19:25:56 »
Всим, хто тоне й не знає,
За що вхопитись,
Хто вже з останніх
Вибився сил:
Попереджаю - я не колода,
Попереджаю - я крокодил.

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: Великі документи
« Відповідей #16 : 2010-01-28 05:52:59 »
kword -v
Qt: 4.5.3
KDE: 4.3.4 (KDE 4.3.4)
KWord: 2.1.0
Начебто все працює, а на яких операціях зазнає краху? Попри все дуже сильно гальмує, це вже справді треба щось для роботи з базою даних, а не текстовий процесор.
ну я вже не згадаю, можливо падало ще коли в беті було, але працювати с таким гальмом все одно неможливо, так що поки що доводиться користуватися меншим злом — ООо і бігати «поміж крапельками» :\
Fedora 35 (x86-64)

Відсутній Сергій Лисовенко

  • Літератор
  • ******
  • дописів: 1489
  • Карма: +0/-0
Re: Великі документи
« Відповідей #17 : 2010-01-28 12:40:08 »
Flame:
Next hint - рекурсія.
А дзуськи: я її не люблю.

ну я вже не згадаю, можливо падало ще коли в беті було, але працювати с таким гальмом все одно неможливо, так що поки що доводиться користуватися меншим злом — ООо і бігати «поміж крапельками» :\
Ваші словники наявні як чистий форматований текст? І яке їх походження?
« Змінено: 2010-01-28 12:46:09 від serg_ik »
Якщо Лінукс написали студенти - нехай вони під ним і навчаються.

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: Великі документи
« Відповідей #18 : 2010-01-28 19:31:22 »
Ваші словники наявні як чистий форматований текст? І яке їх походження?
не зовсім зрозумів, що значить чистий форматований текст? це той що Content-Type: text/pure-formatted-text ? :)
фактично технологічний процес виглядає так: odt -> (купа скриптів) -> xml -> (sql і ts в postgres) -> (php) -> html -> до переглядача
походження різне, але здебільша: оцифровування + вичитування
Fedora 35 (x86-64)

Відсутній Сергій Лисовенко

  • Літератор
  • ******
  • дописів: 1489
  • Карма: +0/-0
Re: Великі документи
« Відповідей #19 : 2010-01-28 20:04:01 »
Не зрозуміло, що робить odt.
Можна ж text (скрипти та ін) -> xml -> ...
Якщо Лінукс написали студенти - нехай вони під ним і навчаються.

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: Великі документи
« Відповідей #20 : 2010-01-28 20:55:44 »
Не зрозуміло, що робить odt.
Можна ж text (скрипти та ін) -> xml -> ...
а форматування звідки візьметься?
Fedora 35 (x86-64)

Відсутній noddeat

  • Кореспондент
  • ***
  • дописів: 197
  • Карма: +0/-0
Re: Великі документи
« Відповідей #21 : 2010-02-01 02:22:20 »
Не зрозуміло, що робить odt.
Можна ж text (скрипти та ін) -> xml -> ...
а форматування звідки візьметься?
а LyX ви не можете для цього процесу використовувати? Він ніби одразу в html вміє експортувати. Чесно кажучи, не дуже зрозумів, навіщо вам ОО.
Filenames are infinite in length, where infinity is set to to 255 characters. Peter Collinson, "The Unix File System"

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: Великі документи
« Відповідей #22 : 2010-02-01 04:59:15 »
Не зрозуміло, що робить odt.
Можна ж text (скрипти та ін) -> xml -> ...
а форматування звідки візьметься?
а LyX ви не можете для цього процесу використовувати? Він ніби одразу в html вміє експортувати. Чесно кажучи, не дуже зрозумів, навіщо вам ОО.

про це вже була дискусія
Fedora 35 (x86-64)

Відсутній Сергій Лисовенко

  • Літератор
  • ******
  • дописів: 1489
  • Карма: +0/-0
Re: Великі документи
« Відповідей #23 : 2010-02-01 17:53:31 »
Не зрозуміло, що робить odt.
Можна ж text (скрипти та ін) -> xml -> ...
а форматування звідки візьметься?

Форматування - зі структури тексту. До того ж в тексті форматування розіб'ється не візуально, а за змістом.
наприклад
\term Бад\'яжити
\item Проводити хімічний синтез.
\item Готувати страву.
\item Писати програму.
\item Виконувати творчу роботу.
може дати щось типу
<word><name>Бадяжити</name>
<spell>Бад\'яжити</spell>
<mention>Проводити хімічний синтез.</mention>
<mention>Готувати страву.</mention>
<mention>Писати програму.</mention>
<mention>Виконувати творчу роботу.</mention>
</word>
« Змінено: 2010-02-01 17:54:17 від serg_ik »
Якщо Лінукс написали студенти - нехай вони під ним і навчаються.

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: Великі документи
« Відповідей #24 : 2010-02-04 04:43:28 »
Форматування - зі структури тексту. До того ж в тексті форматування розіб'ється не візуально, а за змістом.
наприклад
\term Бад\'яжити
\item Проводити хімічний синтез.
\item Готувати страву.
\item Писати програму.
\item Виконувати творчу роботу.
ви колись пробували вичитувати і звіряти з оригіналом файли, в яких 30-40 тис. позицій від одного до декількох рядків кожний з такими тегами? тобто з одного боку у вас є текстовий оригінал з нормальним форматуванням (грубий, курсив...), а з іншого електронна форма з такими тегами...

та й міняти форматування при вичитуванні дододиться мало не більше ніж сам текст, і погодьтеся міняти форматування в WYSIWYG набагато швидше

окрім того форматування скажімо академічного словника зовсім не схоже на \item...\item, зазирніть напр. в статтю «II. Паха́ть» і відкрийте сирці, навіть якщо там буде не xml а спрощені теги оком працювати там буде просто неможливо

плюс там є ще купа інших моментів, наприклад експорт в pdf, обмін з лінгвістами, що працюють лише з вордом і т.п.
Fedora 35 (x86-64)

Відсутній noddeat

  • Кореспондент
  • ***
  • дописів: 197
  • Карма: +0/-0
Re: Великі документи
« Відповідей #25 : 2010-02-04 11:27:22 »
ну, я так розумію, вся проблема в тому, що файл великий. тоді напрошується питання: а якщо його скриптом порізати на шматки, а потім зібрати назад?

друге, це можна замість текстових редакторів зробити веб-пику з WYSIWIG html редактором. Правда, я поняття зеленого не маю, чи ті, що існують, добре перетравлюють великі файли.
« Змінено: 2010-02-04 11:28:32 від noddeat »
Filenames are infinite in length, where infinity is set to to 255 characters. Peter Collinson, "The Unix File System"

Відсутній cadca

  • Письменник
  • *****
  • дописів: 955
  • Карма: +0/-0
  • free like beer
Re: Великі документи
« Відповідей #26 : 2010-02-04 12:12:39 »
З тим документом взагалі все дуже цікаво - content.xml всередині весь одною стрічкою - щось це мені дуже нагадує ;)
Ubuntu 20.04/18.04; CentOS 7.x

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: Великі документи
« Відповідей #27 : 2010-02-04 16:57:34 »
ну, я так розумію, вся проблема в тому, що файл великий. тоді напрошується питання: а якщо його скриптом порізати на шматки, а потім зібрати назад?
ну проблема в тому, що з одним файлом працювати легше, бо багато помилок повторюються, а повторювати ту саму заміну 5-10 разів на різних документах — не в кайф зовсім

друге, це можна замість текстових редакторів зробити веб-пику з WYSIWIG html редактором.
ну для сучасного словника, окремі статті редагуються саме так (у вебі через TinyMCE), але для тих що приходять з оцифрування це не вихід

Правда, я поняття зеленого не маю, чи ті, що існують, добре перетравлюють великі файли.
не перетравлюють, на 100-200кб сирців, вже важко, а тут десятки мегабайт
Fedora 35 (x86-64)

Відсутній DalekiyObriy

  • Літератор
  • ******
  • дописів: 1929
  • Карма: +5/-0
Re: Великі документи
« Відповідей #28 : 2010-02-04 17:00:43 »
З тим документом взагалі все дуже цікаво - content.xml всередині весь одною стрічкою - щось це мені дуже нагадує ;)
ну він не призначений для перегляду людиною, а програмі \n нафіг не потрібно, так що тут все досить логічно

але у мене є скрипт, що ставить \n після кожного параграфу :), щоб можна було переглядати і правити в текстовому редакторі при потребі, плюс після редагувань в мене запускається скрипт, що перевіряє регресії і видає diff, і там без \n нікуди
Fedora 35 (x86-64)

Відсутній z86

  • Новачок
  • *
  • дописів: 8
  • Карма: +0/-0
Re: Великі документи
« Відповідей #29 : 2010-02-09 21:32:49 »
люди то ОпенОфіс жити буде?