אחד המנועים לצמיחתה של חברה היא היכולת לצבור, לנהל ולמנף את הידע העסקי שלה ביעילות. היכולת של יישומים אלה לניהול ושליפת המידע בצורה מדוייקת, ללא תלות בשפת המקור שלו.
מערכות ארגוניות כגון יישומי ניהול ותכנון משאבים (ERP), פורטלים ארגוניים, מערכות ניהול מסמכים, מערכות מבוססות בסיסי נתונים, הפרוסות בארגונים, בדרך כלל מוגדרות לאגור ולפתח את המידע בצורה ייחודית להן. בגלל מורכבות המעבר בין שפות, יכולת החיפוש והגישה למידע עבור המשתמשים, מוגבלת.
השירות המורפולוגי לניתוח טקסט (TMS – Text Morphology Service) מבית WebTech יכול לעזור לחברות להעצים את יכולות היישומים הארגוניים ,לנהל ולמנף את הידע הצבור בהם על ידי מתן שירות לניתוח טקסט בזמן אמת, הנגיש דרך API, ללא תלות בפלטפורמה טכנולוגית או איכות הטקסט המנותח (קרי איות ומבנה לשוני).
ה- API של TMS מאפשר לחפש מידע על ידי ניתוח מורפולוגי של הטקסט, ניתוח Soundex בדיקת איות ומבנה לשוני שלו, בזמן הקלדתו, ללא תלות בפלטפורמה כזו או אחרת, עם אפשרויות רבות להתאמה והרחבת השירות.
השירות מאפשר ניתוח טקסט המחזיר הטיות המילים מבוקשות, כגון:
- יחיד/רבים , זכר/נקבה.
- פירוק מילות יחס.
- בדיקת איות.
- זיהוי טקסט המוזן בצורה שגויה והצעת טקסט אלטרנטיבי.
- בדיקת איות.
- Soundex – תיקון פונטי, אלגוריתם מאפשר לזהות שמות לפי צלילים ואופן הגייתם. לדוגמה: אלגוריטם/אלגוריתם.
פיתחנו Connector ל – WebSphere Portal, שמאפשר:
- שירות Proxy המנתח את דפי הפורטל ומייצר טקסט מנותח עבור כל מילה ומילה בדף
- הגדרת Crawler במנגנון החיפוש ב- WebSphere Portal הניגש לדפי הפורטל דרך ה – Proxy , ה – Crawler אוסף את הטקסט בכל דף ובונה אינדקס מטוייב
- תוסף לשאילתת החיפוש בפורטל המנתח כל מילה בשאילתה ומפרק אותה למילת הבסיס והטיית רבים.
WebTech TMS נגיש באמצעות API ומורכב מ – crawlers האוסף את המידע מפורטלטים ומקורות תוכן מתוך הפורטל ומחוצה לו:
- מערכת התוכן
- מערכת ניהול המסמכים
- תכולת הפורטל – דפים וטקסט בפורטל
- אתרי web חיצוניים
- מערכת קבצים (דורש רשימת קישורים לקבצים)
- IBMConnections