elixir-cloud-aai · Karanjot786 · Jul 26, 2024 · Jul 27, 2024 · Aug 1, 2024 · Aug 5, 2024
diff --git a/.github/workflows/ci.yml b/.github/workflows/ci.yml
@@ -25,7 +25,7 @@ jobs:
 
     - name: Lint with Ruff
       run: |
-        poetry run ruff check crategen/
+        poetry run ruff check crategen/ tests/
 
     - name: Type check with Mypy
       run: |
@@ -39,6 +39,6 @@ jobs:
       run: |
         poetry add pytest pytest-cov pytest-mock
 
-    # - name: Run tests
-    #   run: |
-    #     poetry run pytest --cov=crategen
+    - name: Run tests
+      run: |
+        poetry run pytest --cov=crategen
diff --git a/crategen/cli.py b/crategen/cli.py
@@ -5,10 +5,10 @@
 @click.command()
 @click.option('--input', prompt='Input file', help='Path to the input JSON file.')
 @click.option('--output', prompt='Output file', help='Path to the output JSON file.')
-@click.option('--conversion-type', prompt='Conversion type', type=click.Choice(['tes-to-wrroc', 'wes-to-wrroc']), help='Type of conversion to perform.')
+@click.option('--conversion-type', prompt='Conversion type', type=click.Choice(['tes-to-wrroc', 'wes-to-wrroc', 'wrroc-to-tes', 'wrroc-to-wes']), help='Type of conversion to perform.')
 def cli(input, output, conversion_type):
     """
-    Command Line Interface for converting TES/WES to WRROC.
+    Command Line Interface for converting TES/WES to WRROC and vice versa.
     """
     manager = ConverterManager()
 
@@ -21,6 +21,10 @@ def cli(input, output, conversion_type):
         result = manager.convert_tes_to_wrroc(data)
     elif conversion_type == 'wes-to-wrroc':
         result = manager.convert_wes_to_wrroc(data)
+    elif conversion_type == 'wrroc-to-tes':
+        result = manager.convert_wrroc_to_tes(data)
+    elif conversion_type == 'wrroc-to-wes':
+        result = manager.convert_wrroc_to_wes(data)
 
     # Save the result to the output JSON file
     with open(output, 'w') as output_file:

diff --git a/crategen/converter_manager.py b/crategen/converter_manager.py
@@ -11,3 +11,9 @@ def convert_tes_to_wrroc(self, tes_data):
 
     def convert_wes_to_wrroc(self, wes_data):
         return self.wes_converter.convert_to_wrroc(wes_data)
+
+    def convert_wrroc_to_tes(self, wrroc_data):
+        return self.tes_converter.convert_from_wrroc(wrroc_data)
+
+    def convert_wrroc_to_wes(self, wrroc_data):
+        return self.wes_converter.convert_from_wrroc(wrroc_data)
diff --git a/crategen/converters/tes_converter.py b/crategen/converters/tes_converter.py
@@ -1,52 +1,44 @@
+from pydantic import ValidationError
 from .abstract_converter import AbstractConverter
 from .utils import convert_to_iso8601
+from ..models import TESData, WRROCData
 
 class TESConverter(AbstractConverter):
 
     def convert_to_wrroc(self, tes_data):
-        # Validate and extract data with defaults
-        id = tes_data.get("id", "")
-        name = tes_data.get("name", "")
-        description = tes_data.get("description", "")
-        executors = tes_data.get("executors", [{}])
-        inputs = tes_data.get("inputs", [])
-        outputs = tes_data.get("outputs", [])
-        creation_time = tes_data.get("creation_time", "")
-        end_time = tes_data.get("logs", [{}])[0].get("end_time", "")  # Corrected to fetch from logs
+        try:
+            validated_tes_data = TESData(**tes_data)
+        except ValidationError as e:
+            raise ValueError(f"Invalid TES data: {e}")
 
-        # Convert to WRROC
         wrroc_data = {
-            "@id": id,
-            "name": name,
-            "description": description,
-            "instrument": executors[0].get("image", None) if executors else None,
-            "object": [{"@id": input.get("url", ""), "name": input.get("path", "")} for input in inputs],
-            "result": [{"@id": output.get("url", ""), "name": output.get("path", "")} for output in outputs],
-            "startTime": convert_to_iso8601(creation_time),
-            "endTime": convert_to_iso8601(end_time),
+            "@id": validated_tes_data.id,
+            "name": validated_tes_data.name,
+            "description": validated_tes_data.description,
+            "instrument": validated_tes_data.executors[0].image if validated_tes_data.executors else None,
+            "object": [{"@id": input.url, "name": input.path} for input in validated_tes_data.inputs],
+            "result": [{"@id": output.url, "name": output.path} for output in validated_tes_data.outputs],
+            "startTime": convert_to_iso8601(validated_tes_data.creation_time),
+            "endTime": convert_to_iso8601(validated_tes_data.logs[0].end_time) if validated_tes_data.logs else None,
         }
         return wrroc_data
 
     def convert_from_wrroc(self, wrroc_data):
-        # Validate and extract data with defaults
-        id = wrroc_data.get("@id", "")
-        name = wrroc_data.get("name", "")
-        description = wrroc_data.get("description", "")
-        instrument = wrroc_data.get("instrument", "")
-        object_data = wrroc_data.get("object", [])
-        result_data = wrroc_data.get("result", [])
-        start_time = wrroc_data.get("startTime", "")
-        end_time = wrroc_data.get("endTime", "")
+        try:
+            # Filter only the fields relevant to WRROCData
+            wrroc_filtered_data = {key: wrroc_data.get(key) for key in WRROCData.__fields__ if key in wrroc_data}
+            validated_wrroc_data = WRROCData(**wrroc_filtered_data)
+        except ValidationError as e:
+            raise ValueError(f"Invalid WRROC data: {e}")
 
-        # Convert from WRROC to TES
         tes_data = {
-            "id": id,
-            "name": name,
-            "description": description,
-            "executors": [{"image": instrument}],
-            "inputs": [{"url": obj.get("@id", ""), "path": obj.get("name", "")} for obj in object_data],
-            "outputs": [{"url": res.get("@id", ""), "path": res.get("name", "")} for res in result_data],
-            "creation_time": start_time,
-            "logs": [{"end_time": end_time}],  # Added to logs
+            "id": validated_wrroc_data.id,
+            "name": validated_wrroc_data.name,
+            "description": validated_wrroc_data.description,
+            "executors": [{"image": validated_wrroc_data.instrument}],
+            "inputs": [{"url": obj.id, "path": obj.name} for obj in validated_wrroc_data.object],
+            "outputs": [{"url": res.id, "path": res.name} for res in validated_wrroc_data.result],
+            "creation_time": validated_wrroc_data.startTime,
+            "logs": [{"end_time": validated_wrroc_data.endTime}],
         }
         return tes_data
diff --git a/crategen/converters/wes_converter.py b/crategen/converters/wes_converter.py
@@ -1,46 +1,50 @@
+from pydantic import ValidationError
 from .abstract_converter import AbstractConverter
+from ..models import WESData, WRROCDataWES
 from .utils import convert_to_iso8601
 
 class WESConverter(AbstractConverter):
 
     def convert_to_wrroc(self, wes_data):
-        # Validate and extract data with defaults
-        run_id = wes_data.get("run_id", "")
-        name = wes_data.get("run_log", {}).get("name", "")
-        state = wes_data.get("state", "")
-        start_time = wes_data.get("run_log", {}).get("start_time", "")
-        end_time = wes_data.get("run_log", {}).get("end_time", "")
-        outputs = wes_data.get("outputs", {})
-
-        # Convert to WRROC
+        try:
+            wes_model = WESData(**wes_data)
+        except ValidationError as e:
+            raise ValueError(f"Invalid WES data: {e}")
+        outputs = wes_model.outputs
+
         wrroc_data = {
-            "@id": run_id,
-            "name": name,
-            "status": state,
-            "startTime": convert_to_iso8601(start_time),
-            "endTime": convert_to_iso8601(end_time),
-            "result": [{"@id": output.get("location", ""), "name": output.get("name", "")} for output in outputs],
+            "@id": wes_model.run_id,
+            "name": wes_model.run_log.name,
+            "status": wes_model.state,
+            "startTime": convert_to_iso8601(wes_model.run_log.start_time),
+            "endTime": convert_to_iso8601(wes_model.run_log.end_time),
+            "result": [{"@id": output.location, "name": output.name} for output in outputs],
         }
         return wrroc_data
 
     def convert_from_wrroc(self, wrroc_data):
-        # Validate and extract data with defaults
-        run_id = wrroc_data.get("@id", "")
-        name = wrroc_data.get("name", "")
-        start_time = wrroc_data.get("startTime", "")
-        end_time = wrroc_data.get("endTime", "")
-        state = wrroc_data.get("status", "")
-        result_data = wrroc_data.get("result", [])
-
-        # Convert from WRROC to WES
+        allowed_fields = set(WRROCDataWES.__fields__.keys())
+        unexpected_fields = set(wrroc_data.keys()) - allowed_fields
+
+        if unexpected_fields:
+            raise ValueError(f"Unexpected fields in WRROC data: {unexpected_fields}")
+
+        try:
+            wrroc_filtered_data = {key: wrroc_data.get(key) for key in WRROCDataWES.__fields__}
+            wrroc_model = WRROCDataWES(**wrroc_filtered_data)
+        except ValidationError as e:
+            raise ValueError(f"Invalid WRROC data: {e}")
+
+        result_data = wrroc_model.result
+
         wes_data = {
-            "run_id": run_id,
+            "run_id": wrroc_model.id,
             "run_log": {
-                "name": name,
-                "start_time": start_time,
-                "end_time": end_time,
+                "name": wrroc_model.name,
+                "start_time": wrroc_model.startTime,
+                "end_time": wrroc_model.endTime,
             },
-            "state": state,
-            "outputs": [{"location": res.get("@id", ""), "name": res.get("name", "")} for res in result_data],
+            "state": wrroc_model.status,
+            "outputs": [{"location": res.id, "name": res.name} for res in result_data],
         }
         return wes_data
diff --git a/crategen/models.py b/crategen/models.py
@@ -0,0 +1,92 @@
+from pydantic import BaseModel, Field, validator, root_validator
+from typing import List, Optional, Dict
+
+class Executor(BaseModel):
+    image: str
+    command: List[str]
+
+class TESInputs(BaseModel):
+    url: str
+    path: str
+
+class TESOutputs(BaseModel):
+    url: str
+    path: str
+
+class TESLogs(BaseModel):
+    end_time: Optional[str] = None
+
+class TESData(BaseModel):
+    id: str
+    name: str
+    description: Optional[str] = ""
+    executors: List[Executor]
+    inputs: List[TESInputs]
+    outputs: List[TESOutputs]
+    creation_time: str
+    logs: List[TESLogs]
+
+    class Config:
+        extra = "forbid"
+
+class WESRunLog(BaseModel):
+    name: Optional[str] = None
+    start_time: Optional[str] = None
+    end_time: Optional[str] = None
+    cmd: Optional[List[str]] = None
+    stdout: Optional[str] = None
+    stderr: Optional[str] = None
+    exit_code: Optional[int] = None
+
+class WESOutputs(BaseModel):
+    location: str
+    name: str
+
+class WESRequest(BaseModel):
+    workflow_params: Dict[str, str]
+    workflow_type: str
+    workflow_type_version: str
+    tags: Optional[Dict[str, str]] = None
+
+class WESData(BaseModel):
+    run_id: str
+    request: WESRequest
+    state: str
+    run_log: WESRunLog
+    task_logs: Optional[List[WESRunLog]] = None
+    outputs: List[WESOutputs]
+
+    class Config:
+        extra = "forbid"
+
+class WRROCInputs(BaseModel):
+    id: str
+    name: str
+
+class WRROCOutputs(BaseModel):
+    id: str
+    name: str
+
+class WRROCData(BaseModel):
+    id: str
+    name: str
+    description: Optional[str] = ""
+    instrument: Optional[str] = None
+    object: List[WRROCInputs]
+    result: List[WRROCOutputs]
+    startTime: Optional[str] = None
+    endTime: Optional[str] = None
+
+    class Config:
+        extra = "forbid"
+
+class WRROCDataWES(BaseModel):
+    id: str
+    name: str
+    status: str
+    result: List[WRROCOutputs]
+    startTime: Optional[str] = None
+    endTime: Optional[str] = None
+
+    class Config:
+        extra = "forbid"