Merge pull request #1168 from efenocchi/main

fix(dspy): fixed bug in deeplake_rm retriever part
stanfordnlp · Jun 18, 2024 · 081b637 · 081b637
2 parents 05a4923 + 386aa53
commit 081b637
Showing 1 changed file with 15 additions and 19 deletions.
diff --git a/dspy/retrieve/deeplake_rm.py b/dspy/retrieve/deeplake_rm.py
@@ -11,15 +11,14 @@
 from dsp.utils import dotdict
 
 try:
-    import openai.error
+    import openai
 
     ERRORS = (
-        openai.error.RateLimitError,
-        openai.error.ServiceUnavailableError,
-        openai.error.APIError,
+        openai.RateLimitError,
+        openai.APIError,
     )
 except Exception:
-    ERRORS = (openai.error.RateLimitError, openai.error.APIError)
+    ERRORS = (openai.RateLimitError, openai.APIError)
 
 
 class DeeplakeRM(dspy.Retrieve):
@@ -58,13 +57,15 @@ def __init__(
         k: int = 3,
     ):
         try:
-          from deeplake import VectorStore
+            from deeplake import VectorStore
         except ImportError:
-          raise ImportError(
-              "The 'deeplake' extra is required to use DeepLakeRM. Install it with `pip install dspy-ai[deeplake]`",
-          )
+            raise ImportError("The 'deeplake' extra is required to use DeepLakeRM. Install it with `pip install dspy-ai[deeplake]`",)
+
         self._deeplake_vectorstore_name = deeplake_vectorstore_name
-        self._deeplake_client = deeplake_client
+        self._deeplake_client = deeplake_client(
+            path=self._deeplake_vectorstore_name,
+            embedding_function=self.embedding_function,
+            )
 
         super().__init__(k=k)
 
@@ -73,11 +74,9 @@ def embedding_function(self, texts, model="text-embedding-ada-002"):
             texts = [texts]
 
         texts = [t.replace("\n", " ") for t in texts]
-        return [
-            data["embedding"]
-            for data in openai.Embedding.create(input=texts, model=model)["data"]
-        ]
-
+
+        return [data.embedding for data in openai.embeddings.create(input = texts, model=model).data]
+
     def forward(
         self, query_or_queries: Union[str, List[str]], k: Optional[int],**kwargs,
     ) -> dspy.Prediction:
@@ -103,10 +102,7 @@ def forward(
         passages = defaultdict(float)
         #deeplake doesn't support batch querying, manually querying each query and storing them
         for query in queries:
-            results = self._deeplake_client(
-            path=self._deeplake_vectorstore_name,
-            embedding_function=self.embedding_function,
-            ).search(query, k=k,**kwargs)
+            results = self._deeplake_client.search(query, k=k, **kwargs)
 
             for score,text in zip(results.get('score',0.0),results.get('text',"")):
                 passages[text] += score