Екцел

Категоризујте текст помоћу кључних речи

Categorize Text With Keywords

Екцел формула: Категоризујте текст помоћу кључних речиОпшта формула | _+_ | Резиме

За категоризацију текста помоћу кључних речи са подударањем „садржи“ можете користити функцију СЕАРЦХ уз помоћ ИНДЕКС -а и МАТЦХ -а. У приказаном примеру, формула у Ц5 је:





екцел колико месеци између два датума
{= INDEX (categories, MATCH (TRUE, ISNUMBER ( SEARCH (keywords,text)),0))}

где кључне речи је именовани опсег Е5: Е14, и категорије је именовани опсег Ф5: Ф14.

Напомена: ово је формула низа и мора се унети са цонтрол + схифт + ентер.





Објашњење

У основи, ово је ја НДЕКС и МАТЦХ функција .

Унутар функције МАТЦХ користимо СЕАРЦХ функција да претражујете ћелије у колони Б за сваку наведену кључну реч у именовани опсег кључне речи (Е5: Е14):



 
{= INDEX (categories, MATCH (TRUE, ISNUMBER ( SEARCH (keywords,B5)),0))}

Зато што тражимо више ставки (у именованом опсегу кључне речи ), вратићемо више оваквих резултата:

 
 SEARCH (keywords,B5)

Вредност! грешка се јавља када СЕАРЦХ не може пронаћи текст. Када СЕАРЦХ пронађе подударност, враћа број који одговара положају текста унутар ћелије.

Да бисмо ове резултате променили у употребљивији формат, користимо ИСНУМБЕР функција , који конвертује све вредности у ТРУЕ/ФАЛСЕ на следећи начин:

 
{#VALUE!#VALUE!#VALUE!#VALUE!#VALUE!#VALUE!24#VALUE!#VALUE!#VALUE!}

Овај низ иде у функцију МАТЦХ као лоокуп_арраи , са лоокуп_валуе постављено као ТРУЕ. МАТЦХ враћа позицију првог ТРУЕ -а које пронађе у низу (у овом случају 7) које се даје ИНДЕКС функција као ров_нум :

 
{FALSEFALSEFALSEFALSEFALSEFALSETRUEFALSEFALSEFALSE}

ИНДЕКС враћа 7. ставку у категорије , 'Аутоматски', као крајњи резултат.

Са КСЛООКУП -ом

Са КСЛООКУП функција , ова формула се може донекле поједноставити. КСЛООКУП може користити исту логику која се користи унутар горе наведене функције МАТЦХ, па је еквивалентна формула:

екцел формула за израчунавање процентуалне разлике између два броја
 
= INDEX (categories,7)

КСЛООКУП лоцира прво ТРУЕ у низу и враћа одговарајућу вредност из категорије .

Формуле динамичког низа доступни су у Оффице 365 само.

Спречавање лажних подударања

Један проблем са овим приступом је тај што можете добити лажна подударања из поднизова који се појављују унутар дужих речи. На пример, ако покушате да упоредите 'др', можда ћете пронаћи и 'Андреа', 'пиће', 'суво' итд. Пошто се 'др' појављује унутар ових речи. То се дешава зато што СЕАРЦХ аутоматски врши подударање „садржи“.

За брзо хаковање, можете додати размак око речи за претрагу (нпр. 'Др' или 'др') како бисте избегли хватање 'др' у другој речи. Али ово неће успети ако се 'др' појави прво или последње у ћелији, или се појави са интерпункцијом итд.

Ако вам треба прецизније решење, једна од опција је да то учините нормализује текст прво у а помоћна колона , водећи рачуна да се дода и водећи и задњи простор. Тада можете тражити целе речи окружене размацима.

Аутор Даве Брунс


^