Компютърна лингвистика - наука, която се занимава с проблемите на използването на естествения език в системите за автоматична обработка на информация. Възникна сравнително наскоро - в края на петдесетте и шейсетте години на миналия век. Отначало, по време на своето формиране, той е имал различни имена: математическа лингвистика, изчислителна лингвистика, инженерна лингвистика. Но в началото на осемдесетте години името на компютърната лингвистика остана. През последния половин век са получени значителни научни и практически резултати в областта на компютърната лингвистика: системи за машинен превод на текстове от един естествен език на други, системи за автоматично търсене на информация в текстове, системи за автоматичен анализ и синтез на устна реч и много други са създадени. Но имаше и разочарования. Например проблемът с машинния превод на текстове от един език на друг се оказа много по-сложен, отколкото са си представяли пионерите на машинен превод и техните последователи. Същото може да се каже за автоматизираното търсене на информация в текстове и за задачата за анализ и синтезиране на устната реч. Учените и инженерите вероятно ще трябва да работят усилено, за да постигнат желаните резултати.

Компютърната лингвистика е област на опит, свързана с решаване на проблеми с автоматична обработка на информация, представена на естествен език. Централните научни проблеми на изчислителната лингвистика са проблемът за моделиране на процеса на разбиране на значението на текстовете (преход от текст към формализирано представяне на неговото значение) и проблемът с синтеза на речта (преход от формализирано представяне на значението към текстове в естествен език). Тези проблеми възникват при решаване на редица приложни проблеми и по-специално при проблеми с автоматичното откриване и коригиране на грешки при въвеждане на текстове в компютър, автоматичен анализ и синтез на устната реч, автоматичен превод на текстове от един език на друг, комуникация с компютър на естествен език, автоматична класификация и индексиране на текстови документи, тяхното автоматично обобщаване, търсене на документи в пълнотекстови бази данни. Лингвистичните инструменти, създадени и използвани в компютърната лингвистика, могат условно да бъдат разделени на две части: декларативна и процедурна. Декларативната част включва речници на езикови и речеви единици, текстове и различни граматически таблици, процедурната част - средства за манипулиране на езикови и речеви единици, текстове и граматически таблици .

Успехът в решаването на приложни проблеми на изчислителната лингвистика зависи преди всичко от пълнотата и точността на представянето на декларативните средства в компютърната памет и от качеството на процедурните средства. Към днешна дата необходимото ниво за решаване на тези проблеми все още не е постигнато, въпреки че работата в областта на компютърната лингвистика се извършва във всички развити страни по света. Могат да се отбележат сериозни научни и практически постижения в областта на компютърната лингвистика. Така че в редица страни (Русия, САЩ, Япония и др.) Са изградени експериментални и индустриални системи за машинен превод на текстове от един език на друг, изградени са редица експериментални системи за комуникация с компютри на естествен език, работи се по създаване на терминологични банки с данни, тезауруси, двуезични и многоезични машинни речници (Русия, САЩ, Германия, Франция и др.), изграждат се системи за автоматичен анализ и синтез на устната реч (Русия, САЩ, Япония и др.) ), се провеждат изследвания в областта на изграждането на модели на естествени езици.