GenAI – How To Optimize Query Preprocessing & Embedding Component ?

from sentence_transformer import SentenceTransformer 
import openai

miniLM_L6_v2 = SentenceTransformer('sentence-transformers/all-MiniLM-l6-v2')
miniLM_L12_v2 = SentenceTransformer('sentence-transformers/all-MiniLM-L12-v2')
multi_qa_miniLM = SentenceTransformer('sentence-transformers/multi-qa-MiniLM-l6-v2')
distilroberta = SentenceTransformer('sentence-transformers/all-distilroberta-v1')
paraphrase_miniLM = SentenceTransformer('sentence-transformers/paraphrase-MiniLM-L6-v2')
distiluse_multilingual = SentenceTransformer('sentence-transformers/distiluse-base-multilingual-cased-v1')

# Intel's E5 models (local)
e5_small_v2 = SentenceTransformer('intfloat/e5-small-v2')
multilingual_e5_small = SentenceTransformer('intfloat/multilingual-e5-small')

# ✅ For OpenAI models: Embedding via API (cloud-based)
openai.api_key = "YOUR_OPENAI_API_KEY"

def get_openai_embedding(text, model="text-embedding-3-small"):
    response = openai.Embedding.create(
        input=text,
        model=model
    )
    return response["data"][0]["embedding"]

# Example usage:
text = "Sample input text for embedding"
embedding = get_openai_embedding(text, model="text-embedding-3-small")  # or use "text-embedding-ada-002"

Praudyog

GenAI – How To Optimize Query Preprocessing & Embedding Component ?

GenAI – How To Optimize Query Preprocessing & Embedding Component ?

Table Of Contents:

(1) What Is Query Preprocessing & Embedding Layer ?

(2) How Text Preprocessing Can Add Latency In The Process?

What Is Compiled Regex ?

Example-1:

Example-2:

What Is async Function ?

(3) How Text Embedding Can Add Latency In The Process?

Use Smaller Model .

Popular Light Weight Models.

Add Embedding Cache Layer

Leave a Reply Cancel reply