doxygen/TritonData_8h_source.html

 #ifndef NuSonic_Triton_TritonData
 #define NuSonic_Triton_TritonData

 #include "canvas/Utilities/Exception.h"
 #include "larrecodnn/ImagePatternAlgs/NuSonic/Triton/Span.h"

 #include <vector>
 #include <string>
 #include <unordered_map>
 #include <numeric>
 #include <algorithm>
 #include <memory>
 #include <any>

 #include "grpc_client.h"
 #include "grpc_service.pb.h"

 namespace lartriton {

 //forward declaration
 class TritonClient;

 //aliases for local input and output types
 template <typename DT>
 using TritonInput = std::vector<std::vector<DT>>;
 template <typename DT>
 using TritonOutput = std::vector<triton_span::Span<const DT*>>;

 //store all the info needed for triton input and output
 template <typename IO>
 class TritonData {
 public:
   using Result = nvidia::inferenceserver::client::InferResult;
   using TensorMetadata = inference::ModelMetadataResponse_TensorMetadata;
   using ShapeType = std::vector<int64_t>;
   using ShapeView = triton_span::Span<ShapeType::const_iterator>;

   //constructor
   TritonData(const std::string& name, const TensorMetadata& model_info, bool noBatch);

   //some members can be modified
   bool setShape(const ShapeType& newShape) { return setShape(newShape, true); }
   bool setShape(unsigned loc, int64_t val) { return setShape(loc, val, true); }

   //io accessors
   template <typename DT>
   void toServer(std::shared_ptr<TritonInput<DT>> ptr);
   template <typename DT>
   TritonOutput<DT> fromServer() const;

   //const accessors
   const ShapeView& shape() const { return shape_; }
   int64_t byteSize() const { return byteSize_; }
   const std::string& dname() const { return dname_; }
   unsigned batchSize() const { return batchSize_; }

   //utilities
   bool variableDims() const { return variableDims_; }
   int64_t sizeDims() const { return productDims_; }
   //default to dims if shape isn't filled
   int64_t sizeShape() const { return variableDims_ ? dimProduct(shape_) : sizeDims(); }

 private:
   friend class TritonClient;

   //private accessors only used by client
   bool setShape(const ShapeType& newShape, bool canThrow);
   bool setShape(unsigned loc, int64_t val, bool canThrow);
   void setBatchSize(unsigned bsize);
   void reset();
   void setResult(std::shared_ptr<Result> result) { result_ = result; }
   IO* data() { return data_.get(); }

   //helpers
   bool anyNeg(const ShapeView& vec) const {
     return std::any_of(vec.begin(), vec.end(), [](int64_t i) { return i < 0; });
   }
   int64_t dimProduct(const ShapeView& vec) const {
     return std::accumulate(vec.begin(), vec.end(), 1, std::multiplies<int64_t>());
   }
   void createObject(IO** ioptr) const;

   //members
   std::string name_;
   std::shared_ptr<IO> data_;
   const ShapeType dims_;
   bool noBatch_;
   unsigned batchSize_;
   ShapeType fullShape_;
   ShapeView shape_;
   bool variableDims_;
   int64_t productDims_;
   std::string dname_;
   inference::DataType dtype_;
   int64_t byteSize_;
   std::any holder_;
   std::shared_ptr<Result> result_;
 };

 using TritonInputData = TritonData<nvidia::inferenceserver::client::InferInput>;
 using TritonInputMap = std::unordered_map<std::string, TritonInputData>;
 using TritonOutputData = TritonData<nvidia::inferenceserver::client::InferRequestedOutput>;
 using TritonOutputMap = std::unordered_map<std::string, TritonOutputData>;

 template <>
 void TritonInputData::reset();
 template <>
 void TritonOutputData::reset();
 template <>
 void TritonInputData::createObject(nvidia::inferenceserver::client::InferInput** ioptr) const;
 template <>
 void TritonOutputData::createObject(nvidia::inferenceserver::client::InferRequestedOutput** ioptr) const;

 //explicit template instantiation declarations
 extern template class TritonData<nvidia::inferenceserver::client::InferInput>;
 extern template class TritonData<nvidia::inferenceserver::client::InferRequestedOutput>;

 }
 #endif
name
static QCString name
Definition: declinfo.cpp:673

lartriton::TritonData::data
IO * data()
Definition: TritonData.h:72

lartriton::TritonData::name_
std::string name_
Definition: TritonData.h:84

lartriton::TritonOutputMap
std::unordered_map< std::string, TritonOutputData > TritonOutputMap
Definition: TritonData.h:103

lartriton
Definition: TritonClient.cc:25

result
static QCString result
Definition: fortranscanner.cpp:56614

lartriton::TritonData::setBatchSize
void setBatchSize(unsigned bsize)
Definition: TritonData.cc:100

lartriton::TritonData::setShape
bool setShape(const ShapeType &newShape)
Definition: TritonData.h:42

val
Definition: registry_via_id_test_2.cc:15

lartriton::TritonData::TritonData
TritonData(const std::string &name, const TensorMetadata &model_info, bool noBatch)
Definition: TritonData.cc:27

lartriton::TritonData::dims_
const ShapeType dims_
Definition: TritonData.h:86

lartriton::TritonData::Result
nvidia::inferenceserver::client::InferResult Result
Definition: TritonData.h:33

string
std::string string
Definition: nybbler.cc:12

lartriton::TritonData::holder_
std::any holder_
Definition: TritonData.h:96

lartriton::TritonData::anyNeg
bool anyNeg(const ShapeView &vec) const
Definition: TritonData.h:75

Span.h

lartriton::TritonData::sizeDims
int64_t sizeDims() const
Definition: TritonData.h:59

lartriton::TritonData::variableDims
bool variableDims() const
Definition: TritonData.h:58

lartriton::TritonData::shape
const ShapeView & shape() const
Definition: TritonData.h:52

lartriton::TritonData
Definition: TritonData.h:31

lartriton::TritonData::fullShape_
ShapeType fullShape_
Definition: TritonData.h:89

Exception.h

lartriton::TritonData::ShapeType
std::vector< int64_t > ShapeType
Definition: TritonData.h:35

triton_span::Span::begin
T begin() const
Definition: Span.h:20

lartriton::TritonData::dtype_
inference::DataType dtype_
Definition: TritonData.h:94

triton_span::Span< ShapeType::const_iterator >

lartriton::TritonData::toServer
void toServer(std::shared_ptr< TritonInput< DT >> ptr)
Definition: TritonData.cc:109

lartriton::TritonClient
Definition: TritonClient.h:18

lartriton::TritonData::setResult
void setResult(std::shared_ptr< Result > result)
Definition: TritonData.h:71

triton_span::Span::end
T end() const
Definition: Span.h:21

lartriton::TritonData::byteSize_
int64_t byteSize_
Definition: TritonData.h:95

lartriton::TritonInput
std::vector< std::vector< DT >> TritonInput
Definition: TritonData.h:25

lartriton::TritonData::noBatch_
bool noBatch_
Definition: TritonData.h:87

lartriton::TritonData::reset
void reset()
Definition: TritonData.cc:170

lartriton::TritonData::variableDims_
bool variableDims_
Definition: TritonData.h:91

lartriton::TritonData::batchSize
unsigned batchSize() const
Definition: TritonData.h:55

lartriton::TritonData::sizeShape
int64_t sizeShape() const
Definition: TritonData.h:61

lartriton::TritonData::createObject
void createObject(IO **ioptr) const

lartriton::TritonData::setShape
bool setShape(unsigned loc, int64_t val)
Definition: TritonData.h:43

lartriton::TritonData::shape_
ShapeView shape_
Definition: TritonData.h:90

lartriton::TritonData::batchSize_
unsigned batchSize_
Definition: TritonData.h:88

lartriton::TritonData::result_
std::shared_ptr< Result > result_
Definition: TritonData.h:97

lartriton::TritonOutput
std::vector< triton_span::Span< const DT * >> TritonOutput
Definition: TritonData.h:27

filelisting.loc
loc
Definition: filelisting.py:18

lartriton::TritonData::data_
std::shared_ptr< IO > data_
Definition: TritonData.h:85

lartriton::TritonData::dimProduct
int64_t dimProduct(const ShapeView &vec) const
Definition: TritonData.h:78

lartriton::TritonData::dname
const std::string & dname() const
Definition: TritonData.h:54

lartriton::TritonInputMap
std::unordered_map< std::string, TritonInputData > TritonInputMap
Definition: TritonData.h:101

lartriton::TritonData::byteSize
int64_t byteSize() const
Definition: TritonData.h:53

lartriton::TritonData::TensorMetadata
inference::ModelMetadataResponse_TensorMetadata TensorMetadata
Definition: TritonData.h:34

lartriton::TritonData::dname_
std::string dname_
Definition: TritonData.h:93

lartriton::TritonData::fromServer
TritonOutput< DT > fromServer() const
Definition: TritonData.cc:138

lartriton::TritonData::productDims_
int64_t productDims_
Definition: TritonData.h:92