Страница 1 из 1
Знатоки Worda, Помогите!
Добавлено: 08 июн 2007, 07:46
Александр Богданов
Проблема вот какая: необходимо удалить знаки переносов, полученные после сканирования текстов статей из Свода памятников. Пример: статья о монастыре в селе Кузнецово Шуйского района Ивановской области - обратите внимание на 2-ю и 3-ю строки.
http://www.sobory.ru/article/index.html?object=06256
Слова "по_лей" и "раскры_вается". Эти недоработки я увидел давно, но умышленно не исправлял, что бы иметь возможность задать этот вопрос.
В ручную за 4 дня осилил 50 страниц из 250. Глаза уже вываливаются. Поиск этот символ не обнаруживает!
Добавлено: 08 июн 2007, 08:46
etienne
Если речь идет о статье в каталоге, то я удалить могу.
Когда официально исполнял обязанности модератора старался это всегда делать.
Что касается ворда, то там есть такой значок вверху

Называется "Непечатаемые знаки" (не подумайте ничего плохого)

Если на него нажать, то все переносы и пробелы будут видны
И тогда всё ненужное можно удалить
Добавлено: 08 июн 2007, 08:53
Александр Богданов
Чем собственно и занимаюсь

Конечно, про этот значек я и сам знаю.
В ручную - тяжело, нет ли какого-нибудь способа автоматизировать этот процесс.
В стадии подготовки около сотни статей по Ивановской области из 2 части Свода. Впереди часть третья. Загружать итак загруженных модераторов не хочу.
Добавлено: 08 июн 2007, 09:03
Михаил_К
Я не знаю автоматического способа, но для себя решение этого вопроса упростил следующим образом:
Когда делается распознование, при сохранении текста в ворде ставлю галочку в поле "сохранять форматирование документа". В результате в ворде строки полностью соответствуют первоисточнику.
Соответственно знаки переноса кучкуются только по правому краю текста. Ну и дальше их в ручную, но соответственно, весь текст не вычитываю, а только прохожусь по краю. После очистки от переносов простым форматированием ворда можно уже придать тесту любой желаемый вид.
Добавлено: 08 июн 2007, 10:10
Александр Богданов
Поначалу сохранял форматирование, но в Своде текст представлен ввиде 2-х колонок. Потом поставил галку "Отменить форматирование" текст переносится на всю ширину листа. Так удобнее.
И всё таки - как автоматизировать. (Ещё 2 странички готовы)

Добавлено: 08 июн 2007, 10:45
Олег Щёлоков
Александр Богданов писал(а):В ручную - тяжело, нет ли какого-нибудь способа автоматизировать этот процесс.
Способ очень простой
Выполните следующие действия находясь в редакторе Word двигаясь по выпадающим меню:
Правка>>Заменить>>Специальный>>Мягкий перенос
Таким образом у вас решилась проблема ЧТО менять. Это был служебный значок мягкого переноса.
Далее, на ваше усмотрение, надо скомандовать НА ЧТО менять.
Если в строке "Заменить на:" не указывать ничего, этот символ будет уничтожен в ближайшей строке где находится курсор и далее по всем пунктам, или по желанию сразу, одновременно во всём документе.
Либо вы указываете другой символ на что менять. Например для нужд Каталога для сохранения исходного вида документа можно сразу вставить br квадратных скобочках. Но это врядли нужно, так как страница в Интернете всё равно не повторит полностью внешнего вида документа в книге.
Очень легко можно заменить все знаки абзаца в исходном тексте на следующее сочетание - знак абзаца (для наглядности оставляем) и br в квадратных скобочках один, или два раза.
Потом можно при желании эти все br опять уничтожить точно так же как и их вставили. Если в строке "Заменить на:" ничего не указано, ненужные символы из строки "Найти" уничтожатся.
Если вы случайно сделали не то, и вдруг обнаружили потерю ценных данных, жмите кнопку в виде стрелочки "отмена".
Не забывате в ходе трудов сохранять рабочие копии документа в разных местах и с разными названиями, кашу маслом не испортишь. Ибо, она, такая свежая и наваристая, иногда улетает из под носа вместе с кастрюлей навсегда, достаточного одного лёгкого неосторожного касания. Люди так целые диссертации теряли, одной кнопкой.
Успехов и наслаждений

Добавлено: 08 июн 2007, 11:22
etienne
Александр Богданов писал(а):
В стадии подготовки около сотни статей по Ивановской области из 2 части Свода. Впереди часть третья. Загружать итак загруженных модераторов не хочу.
В таком случае централизованно удалить знаки переноса и заменить знак абзаца на "[br][br]", как предлагает Олег, будет очень полезно.
Василий Вам скажет спасибо

Добавлено: 08 июн 2007, 12:06
Александр Богданов
Олег Олегович! Огромное спасибо! Всё получилось!
А о том, что сохранять надо - так за это не переживайте - у меня взято за правило иметь 2 рабочие копии с разными именами.
Что-то Word пошел капризный. В 97-м такого не было. То и дело вылетает и просится к разработчикам.
Etienne, пример как вставить знак абзаца можно привести. Это br в квадратных скобках где вставляется? Уже на sobory.ru или в Worde можно? И как вставлять - в начале и конце абзаца или только в начале?
Добавлено: 08 июн 2007, 12:18
Александр Богданов
Олег Щёлоков писал(а):
Выполните следующие действия находясь в редакторе Word двигаясь по выпадающим меню:
Правка>>Заменить>>Специальный>>Мягкий перенос
Теперь под каждой статьей имею полное право поставить: "С любезной помощью уважаемого Олега Щёлокова"

Дело-то пошло раз в пять быстрее!!!
Добавлено: 08 июн 2007, 12:25
etienne
Олег Щёлоков писал(а):
Очень легко можно заменить все знаки абзаца в исходном тексте на следующее сочетание - знак абзаца (для наглядности оставляем) и br в квадратных скобочках один, или два раза.
Александр, Вы сейчас заменяли знак переноса на "отсутствие знака вообще"
А можно в добавок, как пишет Олег, заменить знак абзаца на "знак абзаца[br][br]"
Прямо в ворде, а потом полученный результат скопировать в окошко новой статьи на соборах.
В конце или в начале не принципиально, главное чтобы МЕЖДУ абзацами.
Дело в том, что браузер не воспринимает обычный вордовский значок абзаца как таковой. В нашем случае его заменяет тэг [br]
Поставите один [br] - начнется следующее предложение с новой строки, поставите 2 [br] - сначала пустая строка будет, потом следующее предложение. Вообще все тэги, используемые в каталоге, указаны в Справке соавторского интерфейса.
Добавлено: 09 июн 2007, 10:47
Василий Шелёмин
Заранее говорю спасибо, а то я с Вашими переносами тоже все глаза вывихнул. И всё равно много пропустил:-(.
Добавлено: 09 июн 2007, 10:53
Александр Богданов
Василий Шелёмин писал(а):Заранее говорю спасибо, а то я с Вашими переносами тоже все глаза вывихнул. И всё равно много пропустил:-(.
Так сразу же и надавали бы мне по башке!
Я трудолюбивый и к замечаниям отношусь без обид, а с пониманием!
Когда готовишь статью в 20-50 строк, это еще ничего, как сейчас - 750 страниц с фотографиями... Приходится очень много лишнего отсеивать.
Добавлено: 07 июл 2007, 01:59
Александр Богданов
Василий, как вам статьи от 07.07.07. Если есть замечания - выкладывайте, буду исправляться.