Как удалить ссылки из текста?

Понятное дело, что уже давным давно заезженная тема и на многих ресурсах и форумах Интернета об этом не раз говорили. Тогда почему подобные вопросы задаются и сейчас? Не порядок! Пора бы уже разобраться в этом деле и наконец покончить с этим безобразием. Ведь вырезание ссылок из текста это довольно распространенный способ сделать хоть чуточку «уникальным» и полезным для сайта.

Многие программы позволяют это делать, но все же не все. Что там говорить, когда даже стандартный браузерный текстовый процессор CMS WordPress не предоставляет такой функционал. Так же в ранних версиях супер популярного офисного пакета Microsoft Office так же нет таких инструментов, которые зачастую просто необходимы. Не делать же пользователю это все вручную.

К счастью такие продвинутые текстовые процессоры написанные на JavaScript как TinyMCE и множество других подобных, которые сплошь и рядом используются во всяких системах управления контентом уже по умолчанию, из коробки, умеют быстро и просто удалять в тексте. «Как они это делают?», — спросите вы. На самом деле все просто и подобные вещи делаются при помощи так называемых регулярных выражений. Почитать о том, что это такое можно например в Википедии или подобных ресурсах. О том как составлять регулярные выражения так же можно узнать из специализированной литературы, скажу вам по своему опыту, что весьма легко. При этом обучение составлению и пониманию регулярных выражений занимает не более получаса времени.

По сути регулярные выражения это маски (шаблоны) под строки. Вы составляете шаблон и отсеиваете по нему символы, все просто. Итак, как же убрать ссылки из текста. Ниже я приведу код регулярных выражений для совершения этого действия.

Скажу сразу, что самый простой на мой взгляд способ потренироваться с регулярными выражениями это бесплатная программа Notepad++. Там же вы и сможете быстро вырезать любые ссылки из начального текста.

Готовые регулярные выражения для поиска ссылок в тексте

  • <a>([A-Za-z0-9+-\|/., ]+)</a> и <a([A-Za-z0-9+-\|/., ]+)</a>
  • <a>([\D\d\s]+)</a> а так же <a([\D\d\s]+)</a>
  • <a>.*?</a> или более универсальный вариант <a.*?</a>

Вот и собственно все. Это так сказать самый базис. Безусловно придумать различный выражений можно сколь угодно много. Так же использовать эти выражения вы можете в своих программах, благо они универсальны для большинства популярных языков программирования.

Поделиться!
Tags: , , , , , ,

49.71MB | MySQL:51 | 0,287sec