#include "dynamics_gpu.h"
#include <iostream>

#define GPU_1D_KERNEL_LOOP(i, n) \
  for (size_t i = blockIdx.x * blockDim.x + threadIdx.x; i < n; i += blockDim.x * gridDim.x)

#define NUM_THREADS 256
#define NUM_BLOCKS(batch_size) ((batch_size + NUM_THREADS - 1) / NUM_THREADS)

#define casadi_sq(x) (x * x)

// Cleaner wrapper for the generated dynamics
__device__ void _dynamics_gpu(const double *q_in, const double *qdot_in, const double *tau_in, const double *h_in,
                              double *q_out, double *qdot_out)
{
  const double *arg[4] = {q_in, qdot_in, tau_in, h_in};
  double *res[2] = {q_out, qdot_out};

  double a0, a1, a10, a11, a12, a13, a14, a15, a16, a17, a18, a19, a2, a20, a21, a22, a23, a24, a25, a26, a27, a3, a4, a5, a6, a7, a8, a9;
  a0=arg[0]? arg[0][0] : 0;
  a1=arg[3]? arg[3][0] : 0;
  a2=arg[1]? arg[1][0] : 0;
  a3=2.;
  a4=(a1/a3);
  a5=arg[2]? arg[2][0] : 0;
  a6=arg[0]? arg[0][1] : 0;
  a7=cos(a6);
  a8=arg[1]? arg[1][1] : 0;
  a9=sin(a6);
  a10=(a9*a2);
  a11=(a8*a10);
  a12=-5.0000000000000000e-01;
  a13=arg[2]? arg[2][1] : 0;
  a14=(a10*a8);
  a14=(a13+a14);
  a15=(a12*a14);
  a16=5.0000000000000000e-01;
  a10=(a8*a10);
  a17=(a16*a10);
  a15=(a15-a17);
  a11=(a11+a15);
  a11=(a7*a11);
  a15=(a7*a2);
  a17=(a15-a8);
  a17=(a8*a17);
  a15=(a8*a15);
  a17=(a17-a15);
  a17=(a9*a17);
  a11=(a11-a17);
  a11=(a5-a11);
  a17=10.;
  a15=(a16*a7);
  a15=(a15*a7);
  a18=casadi_sq(a9);
  a15=(a15+a18);
  a15=(a17+a15);
  a11=(a11/a15);
  a18=9.8100000000000005e+00;
  a19=(a16*a9);
  a19=(a19*a7);
  a20=(a7*a9);
  a19=(a19-a20);
  a19=(a19/a15);
  a19=(a18*a19);
  a11=(a11-a19);
  a19=(a4*a11);
  a19=(a2+a19);
  a19=(a3*a19);
  a19=(a2+a19);
  a15=(a1/a3);
  a20=(a1/a3);
  a20=(a20*a8);
  a20=(a6+a20);
  a21=cos(a20);
  a22=(a1/a3);
  a14=(a16*a14);
  a7=(a7*a11);
  a9=(a18*a9);
  a7=(a7+a9);
  a7=(a7-a10);
  a7=(a12*a7);
  a14=(a14-a7);
  a7=(a22*a14);
  a7=(a8+a7);
  a20=sin(a20);
  a22=(a22*a11);
  a22=(a2+a22);
  a10=(a20*a22);
  a9=(a7*a10);
  a23=(a10*a7);
  a23=(a13+a23);
  a24=(a12*a23);
  a10=(a7*a10);
  a25=(a16*a10);
  a24=(a24-a25);
  a9=(a9+a24);
  a9=(a21*a9);
  a22=(a21*a22);
  a24=(a22-a7);
  a24=(a7*a24);
  a7=(a7*a22);
  a24=(a24-a7);
  a24=(a20*a24);
  a9=(a9-a24);
  a9=(a5-a9);
  a24=(a16*a21);
  a24=(a24*a21);
  a7=casadi_sq(a20);
  a24=(a24+a7);
  a24=(a17+a24);
  a9=(a9/a24);
  a7=(a16*a20);
  a7=(a7*a21);
  a22=(a21*a20);
  a7=(a7-a22);
  a7=(a7/a24);
  a7=(a18*a7);
  a9=(a9-a7);
  a7=(a15*a9);
  a7=(a2+a7);
  a7=(a3*a7);
  a19=(a19+a7);
  a7=(a1/a3);
  a24=(a4*a14);
  a24=(a8+a24);
  a7=(a7*a24);
  a7=(a6+a7);
  a24=cos(a7);
  a22=(a1/a3);
  a23=(a16*a23);
  a21=(a21*a9);
  a20=(a18*a20);
  a21=(a21+a20);
  a21=(a21-a10);
  a21=(a12*a21);
  a23=(a23-a21);
  a21=(a22*a23);
  a21=(a8+a21);
  a7=sin(a7);
  a22=(a22*a9);
  a22=(a2+a22);
  a10=(a7*a22);
  a20=(a21*a10);
  a25=(a10*a21);
  a25=(a13+a25);
  a26=(a12*a25);
  a10=(a21*a10);
  a27=(a16*a10);
  a26=(a26-a27);
  a20=(a20+a26);
  a20=(a24*a20);
  a22=(a24*a22);
  a26=(a22-a21);
  a26=(a21*a26);
  a21=(a21*a22);
  a26=(a26-a21);
  a26=(a7*a26);
  a20=(a20-a26);
  a20=(a5-a20);
  a26=(a16*a24);
  a26=(a26*a24);
  a21=casadi_sq(a7);
  a26=(a26+a21);
  a26=(a17+a26);
  a20=(a20/a26);
  a21=(a16*a7);
  a21=(a21*a24);
  a22=(a24*a7);
  a21=(a21-a22);
  a21=(a21/a26);
  a21=(a18*a21);
  a20=(a20-a21);
  a21=(a1*a20);
  a21=(a2+a21);
  a19=(a19+a21);
  a21=6.;
  a19=(a19/a21);
  a19=(a1*a19);
  a0=(a0+a19);
  if (res[0]!=0) res[0][0]=a0;
  a4=(a4*a14);
  a4=(a8+a4);
  a4=(a3*a4);
  a4=(a8+a4);
  a0=(a15*a23);
  a0=(a8+a0);
  a0=(a3*a0);
  a4=(a4+a0);
  a25=(a16*a25);
  a24=(a24*a20);
  a7=(a18*a7);
  a24=(a24+a7);
  a24=(a24-a10);
  a24=(a12*a24);
  a25=(a25-a24);
  a24=(a1*a25);
  a24=(a8+a24);
  a4=(a4+a24);
  a4=(a4/a21);
  a4=(a1*a4);
  a4=(a6+a4);
  if (res[0]!=0) res[0][1]=a4;
  a9=(a3*a9);
  a11=(a11+a9);
  a9=(a3*a20);
  a11=(a11+a9);
  a15=(a15*a23);
  a15=(a8+a15);
  a15=(a1*a15);
  a6=(a6+a15);
  a15=cos(a6);
  a9=(a1*a25);
  a9=(a8+a9);
  a6=sin(a6);
  a20=(a1*a20);
  a20=(a2+a20);
  a4=(a6*a20);
  a24=(a9*a4);
  a10=(a4*a9);
  a13=(a13+a10);
  a10=(a12*a13);
  a4=(a9*a4);
  a7=(a16*a4);
  a10=(a10-a7);
  a24=(a24+a10);
  a24=(a15*a24);
  a20=(a15*a20);
  a10=(a20-a9);
  a10=(a9*a10);
  a9=(a9*a20);
  a10=(a10-a9);
  a10=(a6*a10);
  a24=(a24-a10);
  a5=(a5-a24);
  a24=(a16*a15);
  a24=(a24*a15);
  a10=casadi_sq(a6);
  a24=(a24+a10);
  a17=(a17+a24);
  a5=(a5/a17);
  a24=(a16*a6);
  a24=(a24*a15);
  a10=(a15*a6);
  a24=(a24-a10);
  a24=(a24/a17);
  a24=(a18*a24);
  a5=(a5-a24);
  a11=(a11+a5);
  a11=(a11/a21);
  a11=(a1*a11);
  a2=(a2+a11);
  if (res[1]!=0) res[1][0]=a2;
  a23=(a3*a23);
  a14=(a14+a23);
  a3=(a3*a25);
  a14=(a14+a3);
  a16=(a16*a13);
  a15=(a15*a5);
  a18=(a18*a6);
  a15=(a15+a18);
  a15=(a15-a4);
  a12=(a12*a15);
  a16=(a16-a12);
  a14=(a14+a16);
  a14=(a14/a21);
  a1=(a1*a14);
  a8=(a8+a1);
  if (res[1]!=0) res[1][1]=a8;
}

__device__ void _derivatives_gpu(const double *q_in, const double *qdot_in, const double *tau_in, const double *h_in,
                                 double *q_jac_qout, double *q_jac_qdotout, double *q_jac_uout,
                                 double *qdot_jac_qout, double *qdot_jac_qdotout, double *qdot_jac_tauout)
{
  const double *arg[4] = {q_in, qdot_in, tau_in, h_in};
  double *res[6] = {q_jac_qout, q_jac_qdotout, q_jac_uout, qdot_jac_qout, qdot_jac_qdotout, qdot_jac_tauout};

  double a0, a1, a10, a11, a12, a13, a14, a15, a16, a17, a18, a19, a2, a20, a21, a22, a23, a24, a25, a26, a27, a28, a29, a3, a30, a31, a32, a33, a34, a35, a36, a37, a38, a39, a4, a40, a41, a42, a43, a44, a45, a46, a47, a48, a49, a5, a50, a51, a52, a53, a54, a55, a56, a57, a58, a59, a6, a60, a61, a62, a63, a64, a65, a66, a67, a68, a69, a7, a70, a71, a72, a73, a74, a75, a76, a77, a78, a79, a8, a80, a81, a82, a83, a84, a85, a86, a87, a88, a89, a9;
  a0=1.;
  if (res[0]!=0) res[0][0]=a0;
  a1=0.;
  if (res[0]!=0) res[0][1]=a1;
  a2=arg[3]? arg[3][0] : 0;
  a3=1.6666666666666666e-01;
  a4=2.;
  a5=(a2/a4);
  a6=arg[0]? arg[0][1] : 0;
  a7=cos(a6);
  a8=arg[1]? arg[1][1] : 0;
  a9=arg[1]? arg[1][0] : 0;
  a10=cos(a6);
  a11=(a9*a10);
  a12=(a8*a11);
  a13=-5.0000000000000000e-01;
  a14=(a8*a11);
  a15=(a13*a14);
  a16=5.0000000000000000e-01;
  a11=(a8*a11);
  a17=(a16*a11);
  a15=(a15-a17);
  a12=(a12+a15);
  a12=(a7*a12);
  a15=sin(a6);
  a17=(a15*a9);
  a18=(a8*a17);
  a19=arg[2]? arg[2][1] : 0;
  a20=(a17*a8);
  a20=(a19+a20);
  a21=(a13*a20);
  a22=(a8*a17);
  a23=(a16*a22);
  a21=(a21-a23);
  a18=(a18+a21);
  a21=sin(a6);
  a23=(a18*a21);
  a12=(a12-a23);
  a23=(a7*a9);
  a24=(a23-a8);
  a25=(a8*a24);
  a26=(a8*a23);
  a25=(a25-a26);
  a26=(a25*a10);
  a12=(a12-a26);
  a26=10.;
  a27=(a16*a7);
  a28=(a27*a7);
  a29=casadi_sq(a15);
  a28=(a28+a29);
  a28=(a26+a28);
  a12=(a12/a28);
  a29=arg[2]? arg[2][0] : 0;
  a30=(a7*a18);
  a31=(a15*a25);
  a30=(a30-a31);
  a30=(a29-a30);
  a30=(a30/a28);
  a31=(a30/a28);
  a32=(a15+a15);
  a32=(a32*a10);
  a33=(a16*a21);
  a33=(a7*a33);
  a34=(a27*a21);
  a33=(a33+a34);
  a32=(a32-a33);
  a31=(a31*a32);
  a12=(a12+a31);
  a31=9.8100000000000005e+00;
  a33=(a16*a10);
  a33=(a7*a33);
  a34=(a16*a15);
  a35=(a34*a21);
  a33=(a33-a35);
  a35=casadi_sq(a7);
  a36=casadi_sq(a15);
  a35=(a35-a36);
  a33=(a33-a35);
  a33=(a33/a28);
  a35=(a34*a7);
  a36=(a7*a15);
  a35=(a35-a36);
  a35=(a35/a28);
  a36=(a35/a28);
  a36=(a36*a32);
  a33=(a33-a36);
  a33=(a31*a33);
  a12=(a12+a33);
  a33=(a5*a12);
  a33=(a4*a33);
  a36=(a2/a4);
  a32=(a2/a4);
  a37=(a32*a8);
  a37=(a6+a37);
  a38=cos(a37);
  a39=sin(a37);
  a40=(a2/a4);
  a41=(a31*a35);
  a41=(a30-a41);
  a42=(a40*a41);
  a42=(a9+a42);
  a43=(a39*a42);
  a14=(a16*a14);
  a10=(a31*a10);
  a21=(a41*a21);
  a44=(a7*a12);
  a21=(a21+a44);
  a10=(a10-a21);
  a10=(a10-a11);
  a10=(a13*a10);
  a14=(a14-a10);
  a10=(a40*a14);
  a11=(a43*a10);
  a20=(a16*a20);
  a21=(a7*a41);
  a44=(a31*a15);
  a21=(a21+a44);
  a21=(a21-a22);
  a21=(a13*a21);
  a20=(a20-a21);
  a21=(a40*a20);
  a21=(a8+a21);
  a22=cos(a37);
  a44=(a42*a22);
  a12=(a40*a12);
  a45=(a39*a12);
  a44=(a44-a45);
  a45=(a21*a44);
  a11=(a11+a45);
  a45=(a21*a44);
  a46=(a43*a10);
  a45=(a45+a46);
  a46=(a13*a45);
  a47=(a43*a10);
  a44=(a21*a44);
  a47=(a47+a44);
  a44=(a16*a47);
  a46=(a46-a44);
  a11=(a11+a46);
  a11=(a38*a11);
  a46=(a21*a43);
  a44=(a43*a21);
  a44=(a19+a44);
  a48=(a13*a44);
  a49=(a21*a43);
  a50=(a16*a49);
  a48=(a48-a50);
  a46=(a46+a48);
  a48=sin(a37);
  a50=(a46*a48);
  a11=(a11-a50);
  a50=(a38*a42);
  a51=(a50-a21);
  a52=(a21*a51);
  a53=(a21*a50);
  a52=(a52-a53);
  a53=(a52*a22);
  a54=(a51*a10);
  a55=(a42*a48);
  a12=(a38*a12);
  a55=(a55+a12);
  a12=(a55+a10);
  a12=(a21*a12);
  a54=(a54-a12);
  a10=(a50*a10);
  a55=(a21*a55);
  a10=(a10-a55);
  a54=(a54-a10);
  a54=(a39*a54);
  a53=(a53+a54);
  a11=(a11-a53);
  a53=(a16*a38);
  a54=(a53*a38);
  a10=casadi_sq(a39);
  a54=(a54+a10);
  a54=(a26+a54);
  a11=(a11/a54);
  a10=(a38*a46);
  a55=(a39*a52);
  a10=(a10-a55);
  a10=(a29-a10);
  a10=(a10/a54);
  a55=(a10/a54);
  a12=(a39+a39);
  a12=(a12*a22);
  a56=(a16*a48);
  a56=(a38*a56);
  a57=(a53*a48);
  a56=(a56+a57);
  a12=(a12-a56);
  a55=(a55*a12);
  a11=(a11+a55);
  a55=(a16*a22);
  a55=(a38*a55);
  a56=(a16*a39);
  a57=(a56*a48);
  a55=(a55-a57);
  a57=casadi_sq(a38);
  a58=casadi_sq(a39);
  a57=(a57-a58);
  a55=(a55-a57);
  a55=(a55/a54);
  a57=(a56*a38);
  a58=(a38*a39);
  a57=(a57-a58);
  a57=(a57/a54);
  a58=(a57/a54);
  a58=(a58*a12);
  a55=(a55-a58);
  a55=(a31*a55);
  a11=(a11+a55);
  a55=(a36*a11);
  a55=(a4*a55);
  a33=(a33+a55);
  a55=(a2/a4);
  a20=(a5*a20);
  a20=(a8+a20);
  a20=(a55*a20);
  a20=(a6+a20);
  a58=cos(a20);
  a12=sin(a20);
  a59=(a2/a4);
  a60=(a31*a57);
  a60=(a10-a60);
  a61=(a59*a60);
  a61=(a9+a61);
  a62=(a12*a61);
  a45=(a16*a45);
  a22=(a31*a22);
  a48=(a60*a48);
  a63=(a38*a11);
  a48=(a48+a63);
  a22=(a22-a48);
  a22=(a22-a47);
  a22=(a13*a22);
  a45=(a45-a22);
  a22=(a59*a45);
  a47=(a62*a22);
  a44=(a16*a44);
  a48=(a38*a60);
  a63=(a31*a39);
  a48=(a48+a63);
  a48=(a48-a49);
  a48=(a13*a48);
  a44=(a44-a48);
  a48=(a59*a44);
  a48=(a8+a48);
  a49=cos(a20);
  a63=(a5*a14);
  a63=(a55*a63);
  a63=(a0+a63);
  a49=(a49*a63);
  a64=(a61*a49);
  a11=(a59*a11);
  a65=(a12*a11);
  a64=(a64-a65);
  a65=(a48*a64);
  a47=(a47+a65);
  a65=(a48*a64);
  a66=(a62*a22);
  a65=(a65+a66);
  a66=(a13*a65);
  a67=(a62*a22);
  a64=(a48*a64);
  a67=(a67+a64);
  a64=(a16*a67);
  a66=(a66-a64);
  a47=(a47+a66);
  a47=(a58*a47);
  a66=(a48*a62);
  a64=(a62*a48);
  a64=(a19+a64);
  a68=(a13*a64);
  a69=(a48*a62);
  a70=(a16*a69);
  a68=(a68-a70);
  a66=(a66+a68);
  a68=sin(a20);
  a68=(a68*a63);
  a63=(a66*a68);
  a47=(a47-a63);
  a63=(a58*a61);
  a70=(a63-a48);
  a71=(a48*a70);
  a72=(a48*a63);
  a71=(a71-a72);
  a72=(a71*a49);
  a73=(a70*a22);
  a74=(a61*a68);
  a11=(a58*a11);
  a74=(a74+a11);
  a11=(a74+a22);
  a11=(a48*a11);
  a73=(a73-a11);
  a22=(a63*a22);
  a74=(a48*a74);
  a22=(a22-a74);
  a73=(a73-a22);
  a73=(a12*a73);
  a72=(a72+a73);
  a47=(a47-a72);
  a72=(a16*a58);
  a73=(a72*a58);
  a22=casadi_sq(a12);
  a73=(a73+a22);
  a73=(a26+a73);
  a47=(a47/a73);
  a22=(a58*a66);
  a74=(a12*a71);
  a22=(a22-a74);
  a22=(a29-a22);
  a22=(a22/a73);
  a74=(a22/a73);
  a11=(a12+a12);
  a11=(a11*a49);
  a75=(a16*a68);
  a75=(a58*a75);
  a76=(a72*a68);
  a75=(a75+a76);
  a11=(a11-a75);
  a74=(a74*a11);
  a47=(a47+a74);
  a74=(a16*a49);
  a74=(a58*a74);
  a75=(a16*a12);
  a76=(a75*a68);
  a74=(a74-a76);
  a76=(a58*a49);
  a77=(a12*a68);
  a76=(a76-a77);
  a74=(a74-a76);
  a74=(a74/a73);
  a76=(a75*a58);
  a77=(a58*a12);
  a76=(a76-a77);
  a76=(a76/a73);
  a77=(a76/a73);
  a77=(a77*a11);
  a74=(a74-a77);
  a74=(a31*a74);
  a47=(a47+a74);
  a74=(a2*a47);
  a33=(a33+a74);
  a33=(a3*a33);
  a33=(a2*a33);
  a33=(-a33);
  if (res[0]!=0) res[0][2]=a33;
  a14=(a5*a14);
  a14=(a4*a14);
  a45=(a36*a45);
  a45=(a4*a45);
  a14=(a14+a45);
  a65=(a16*a65);
  a49=(a31*a49);
  a45=(a31*a76);
  a45=(a22-a45);
  a68=(a45*a68);
  a47=(a58*a47);
  a68=(a68+a47);
  a49=(a49-a68);
  a49=(a49-a67);
  a49=(a13*a49);
  a65=(a65-a49);
  a65=(a2*a65);
  a14=(a14+a65);
  a14=(a3*a14);
  a14=(a2*a14);
  a14=(a0+a14);
  if (res[0]!=0) res[0][3]=a14;
  a14=(a8*a15);
  a65=(a8*a15);
  a49=(a13*a65);
  a67=(a8*a15);
  a68=(a16*a67);
  a49=(a49-a68);
  a14=(a14+a49);
  a14=(a7*a14);
  a14=(a14/a28);
  a49=(a5*a14);
  a49=(a0-a49);
  a49=(a4*a49);
  a49=(a0+a49);
  a65=(a16*a65);
  a68=(a7*a14);
  a68=(a68+a67);
  a68=(a13*a68);
  a65=(a65+a68);
  a68=(a40*a65);
  a67=(a43*a68);
  a14=(a40*a14);
  a14=(a0-a14);
  a47=(a39*a14);
  a33=(a21*a47);
  a67=(a67+a33);
  a33=(a21*a47);
  a74=(a43*a68);
  a33=(a33+a74);
  a74=(a13*a33);
  a77=(a43*a68);
  a47=(a21*a47);
  a77=(a77+a47);
  a47=(a16*a77);
  a74=(a74-a47);
  a67=(a67+a74);
  a67=(a38*a67);
  a74=(a51*a68);
  a14=(a38*a14);
  a47=(a14-a68);
  a47=(a21*a47);
  a74=(a74+a47);
  a68=(a50*a68);
  a14=(a21*a14);
  a68=(a68+a14);
  a74=(a74-a68);
  a74=(a39*a74);
  a67=(a67-a74);
  a67=(a67/a54);
  a74=(a36*a67);
  a74=(a0-a74);
  a74=(a4*a74);
  a49=(a49+a74);
  a33=(a16*a33);
  a74=(a38*a67);
  a74=(a74+a77);
  a74=(a13*a74);
  a33=(a33+a74);
  a74=(a59*a33);
  a77=(a62*a74);
  a68=cos(a20);
  a14=(a5*a65);
  a14=(a55*a14);
  a47=(a68*a14);
  a11=(a61*a47);
  a67=(a59*a67);
  a67=(a0-a67);
  a78=(a12*a67);
  a11=(a11+a78);
  a78=(a48*a11);
  a77=(a77+a78);
  a78=(a48*a11);
  a79=(a62*a74);
  a78=(a78+a79);
  a79=(a13*a78);
  a80=(a62*a74);
  a11=(a48*a11);
  a80=(a80+a11);
  a11=(a16*a80);
  a79=(a79-a11);
  a77=(a77+a79);
  a77=(a58*a77);
  a79=sin(a20);
  a14=(a79*a14);
  a11=(a66*a14);
  a77=(a77-a11);
  a11=(a71*a47);
  a81=(a70*a74);
  a67=(a58*a67);
  a82=(a61*a14);
  a67=(a67-a82);
  a82=(a67-a74);
  a82=(a48*a82);
  a81=(a81+a82);
  a74=(a63*a74);
  a67=(a48*a67);
  a74=(a74+a67);
  a81=(a81-a74);
  a81=(a12*a81);
  a11=(a11+a81);
  a77=(a77-a11);
  a77=(a77/a73);
  a11=(a22/a73);
  a81=(a12+a12);
  a74=(a81*a47);
  a67=(a16*a14);
  a67=(a58*a67);
  a82=(a72*a14);
  a67=(a67+a82);
  a74=(a74-a67);
  a67=(a11*a74);
  a77=(a77+a67);
  a67=(a16*a47);
  a67=(a58*a67);
  a82=(a75*a14);
  a67=(a67-a82);
  a82=(a58*a47);
  a83=(a12*a14);
  a82=(a82-a83);
  a67=(a67-a82);
  a67=(a67/a73);
  a82=(a76/a73);
  a74=(a82*a74);
  a67=(a67-a74);
  a67=(a31*a67);
  a77=(a77+a67);
  a67=(a2*a77);
  a67=(a0-a67);
  a49=(a49+a67);
  a49=(a3*a49);
  a49=(a2*a49);
  if (res[1]!=0) res[1][0]=a49;
  a65=(a5*a65);
  a65=(a4*a65);
  a33=(a36*a33);
  a33=(a4*a33);
  a65=(a65+a33);
  a78=(a16*a78);
  a47=(a31*a47);
  a14=(a45*a14);
  a77=(a58*a77);
  a14=(a14+a77);
  a47=(a47-a14);
  a47=(a47-a80);
  a47=(a13*a47);
  a78=(a78-a47);
  a78=(a2*a78);
  a65=(a65+a78);
  a65=(a3*a65);
  a65=(a2*a65);
  if (res[1]!=0) res[1][1]=a65;
  a65=(a13*a17);
  a78=(a16*a17);
  a65=(a65-a78);
  a65=(a17+a65);
  a65=(a7*a65);
  a78=(a24-a8);
  a78=(a78-a23);
  a78=(a15*a78);
  a65=(a65-a78);
  a65=(a65/a28);
  a78=(a5*a65);
  a78=(a4*a78);
  a47=(a16*a17);
  a80=(a7*a65);
  a80=(a80+a17);
  a80=(a13*a80);
  a47=(a47+a80);
  a80=(a40*a47);
  a80=(a0+a80);
  a14=(a43*a80);
  a77=cos(a37);
  a77=(a77*a32);
  a33=(a42*a77);
  a65=(a40*a65);
  a49=(a39*a65);
  a33=(a33-a49);
  a49=(a21*a33);
  a14=(a14+a49);
  a49=(a21*a33);
  a67=(a43*a80);
  a49=(a49+a67);
  a67=(a13*a49);
  a74=(a43*a80);
  a33=(a21*a33);
  a74=(a74+a33);
  a33=(a16*a74);
  a67=(a67-a33);
  a14=(a14+a67);
  a14=(a38*a14);
  a67=sin(a37);
  a67=(a67*a32);
  a33=(a46*a67);
  a14=(a14-a33);
  a33=(a52*a77);
  a83=(a51*a80);
  a84=(a42*a67);
  a65=(a38*a65);
  a84=(a84+a65);
  a65=(a84+a80);
  a65=(a21*a65);
  a83=(a83-a65);
  a80=(a50*a80);
  a84=(a21*a84);
  a80=(a80-a84);
  a83=(a83-a80);
  a83=(a39*a83);
  a33=(a33+a83);
  a14=(a14-a33);
  a14=(a14/a54);
  a33=(a10/a54);
  a83=(a39+a39);
  a83=(a83*a77);
  a80=(a16*a67);
  a80=(a38*a80);
  a84=(a53*a67);
  a80=(a80+a84);
  a83=(a83-a80);
  a33=(a33*a83);
  a14=(a14+a33);
  a33=(a16*a77);
  a33=(a38*a33);
  a80=(a56*a67);
  a33=(a33-a80);
  a80=(a38*a77);
  a84=(a39*a67);
  a80=(a80-a84);
  a33=(a33-a80);
  a33=(a33/a54);
  a80=(a57/a54);
  a80=(a80*a83);
  a33=(a33-a80);
  a33=(a31*a33);
  a14=(a14+a33);
  a33=(a36*a14);
  a33=(a4*a33);
  a78=(a78+a33);
  a49=(a16*a49);
  a77=(a31*a77);
  a67=(a60*a67);
  a33=(a38*a14);
  a67=(a67+a33);
  a77=(a77-a67);
  a77=(a77-a74);
  a77=(a13*a77);
  a49=(a49-a77);
  a77=(a59*a49);
  a77=(a0+a77);
  a74=(a62*a77);
  a67=(a5*a47);
  a67=(a0+a67);
  a67=(a55*a67);
  a68=(a68*a67);
  a33=(a61*a68);
  a14=(a59*a14);
  a80=(a12*a14);
  a33=(a33-a80);
  a80=(a48*a33);
  a74=(a74+a80);
  a80=(a48*a33);
  a83=(a62*a77);
  a80=(a80+a83);
  a83=(a13*a80);
  a84=(a62*a77);
  a33=(a48*a33);
  a84=(a84+a33);
  a33=(a16*a84);
  a83=(a83-a33);
  a74=(a74+a83);
  a74=(a58*a74);
  a79=(a79*a67);
  a67=(a66*a79);
  a74=(a74-a67);
  a67=(a71*a68);
  a83=(a70*a77);
  a33=(a61*a79);
  a14=(a58*a14);
  a33=(a33+a14);
  a14=(a33+a77);
  a14=(a48*a14);
  a83=(a83-a14);
  a77=(a63*a77);
  a33=(a48*a33);
  a77=(a77-a33);
  a83=(a83-a77);
  a83=(a12*a83);
  a67=(a67+a83);
  a74=(a74-a67);
  a74=(a74/a73);
  a81=(a81*a68);
  a67=(a16*a79);
  a67=(a58*a67);
  a83=(a72*a79);
  a67=(a67+a83);
  a81=(a81-a67);
  a11=(a11*a81);
  a74=(a74+a11);
  a11=(a16*a68);
  a11=(a58*a11);
  a67=(a75*a79);
  a11=(a11-a67);
  a67=(a58*a68);
  a83=(a12*a79);
  a67=(a67-a83);
  a11=(a11-a67);
  a11=(a11/a73);
  a82=(a82*a81);
  a11=(a11-a82);
  a11=(a31*a11);
  a74=(a74+a11);
  a11=(a2*a74);
  a78=(a78+a11);
  a78=(a3*a78);
  a78=(a2*a78);
  a78=(-a78);
  if (res[1]!=0) res[1][2]=a78;
  a47=(a5*a47);
  a47=(a0+a47);
  a47=(a4*a47);
  a47=(a0+a47);
  a49=(a36*a49);
  a49=(a0+a49);
  a49=(a4*a49);
  a47=(a47+a49);
  a80=(a16*a80);
  a68=(a31*a68);
  a79=(a45*a79);
  a74=(a58*a74);
  a79=(a79+a74);
  a68=(a68-a79);
  a68=(a68-a84);
  a68=(a13*a68);
  a80=(a80-a68);
  a80=(a2*a80);
  a80=(a0+a80);
  a47=(a47+a80);
  a47=(a3*a47);
  a47=(a2*a47);
  if (res[1]!=0) res[1][3]=a47;
  a47=(a5/a28);
  a47=(a4*a47);
  a80=(a40/a28);
  a68=(a39*a80);
  a84=(a21*a68);
  a79=(a7/a28);
  a79=(a13*a79);
  a74=(a40*a79);
  a49=(a43*a74);
  a84=(a84-a49);
  a49=(a21*a68);
  a78=(a43*a74);
  a49=(a49-a78);
  a78=(a13*a49);
  a68=(a21*a68);
  a11=(a43*a74);
  a68=(a68-a11);
  a11=(a16*a68);
  a78=(a78-a11);
  a84=(a84+a78);
  a84=(a38*a84);
  a80=(a38*a80);
  a78=(a80+a74);
  a78=(a21*a78);
  a11=(a51*a74);
  a78=(a78-a11);
  a80=(a21*a80);
  a74=(a50*a74);
  a80=(a80-a74);
  a78=(a78-a80);
  a78=(a39*a78);
  a84=(a84-a78);
  a84=(a0-a84);
  a84=(a84/a54);
  a78=(a36*a84);
  a78=(a4*a78);
  a47=(a47+a78);
  a78=sin(a20);
  a80=(a5*a79);
  a80=(a55*a80);
  a74=(a78*a80);
  a11=(a66*a74);
  a49=(a16*a49);
  a82=(a38*a84);
  a82=(a82-a68);
  a82=(a13*a82);
  a49=(a49-a82);
  a82=(a59*a49);
  a68=(a62*a82);
  a84=(a59*a84);
  a81=(a12*a84);
  a67=cos(a20);
  a80=(a67*a80);
  a83=(a61*a80);
  a81=(a81-a83);
  a83=(a48*a81);
  a68=(a68+a83);
  a83=(a48*a81);
  a77=(a62*a82);
  a83=(a83+a77);
  a77=(a13*a83);
  a33=(a62*a82);
  a81=(a48*a81);
  a33=(a33+a81);
  a81=(a16*a33);
  a77=(a77-a81);
  a68=(a68+a77);
  a68=(a58*a68);
  a11=(a11+a68);
  a68=(a70*a82);
  a77=(a61*a74);
  a84=(a58*a84);
  a77=(a77+a84);
  a84=(a77-a82);
  a84=(a48*a84);
  a68=(a68+a84);
  a82=(a63*a82);
  a77=(a48*a77);
  a82=(a82+a77);
  a68=(a68-a82);
  a68=(a12*a68);
  a82=(a71*a80);
  a68=(a68-a82);
  a11=(a11-a68);
  a11=(a0-a11);
  a11=(a11/a73);
  a68=(a22/a73);
  a82=(a16*a74);
  a82=(a58*a82);
  a77=(a72*a74);
  a82=(a82+a77);
  a77=(a12+a12);
  a84=(a77*a80);
  a82=(a82-a84);
  a84=(a68*a82);
  a11=(a11-a84);
  a84=(a75*a74);
  a81=(a16*a80);
  a81=(a58*a81);
  a84=(a84-a81);
  a81=(a12*a74);
  a14=(a58*a80);
  a81=(a81-a14);
  a84=(a84-a81);
  a84=(a84/a73);
  a81=(a76/a73);
  a82=(a81*a82);
  a84=(a84-a82);
  a84=(a31*a84);
  a11=(a11-a84);
  a84=(a2*a11);
  a47=(a47+a84);
  a47=(a3*a47);
  a47=(a2*a47);
  if (res[2]!=0) res[2][0]=a47;
  a49=(a36*a49);
  a49=(a4*a49);
  a79=(a5*a79);
  a79=(a4*a79);
  a49=(a49-a79);
  a83=(a16*a83);
  a74=(a45*a74);
  a11=(a58*a11);
  a74=(a74+a11);
  a80=(a31*a80);
  a74=(a74-a80);
  a74=(a74-a33);
  a74=(a13*a74);
  a83=(a83-a74);
  a83=(a2*a83);
  a49=(a49+a83);
  a49=(a3*a49);
  a49=(a2*a49);
  if (res[2]!=0) res[2][1]=a49;
  a49=(a13*a7);
  a49=(a49/a28);
  a83=(a5*a49);
  a83=(a4*a83);
  a74=(a7*a49);
  a74=(a13*a74);
  a74=(a16+a74);
  a33=(a40*a74);
  a80=(a43*a33);
  a49=(a40*a49);
  a11=(a39*a49);
  a79=(a21*a11);
  a80=(a80-a79);
  a79=(a43*a33);
  a47=(a21*a11);
  a79=(a79-a47);
  a79=(a0+a79);
  a47=(a13*a79);
  a84=(a43*a33);
  a11=(a21*a11);
  a84=(a84-a11);
  a11=(a16*a84);
  a47=(a47-a11);
  a80=(a80+a47);
  a80=(a38*a80);
  a47=(a51*a33);
  a49=(a38*a49);
  a11=(a49+a33);
  a11=(a21*a11);
  a47=(a47-a11);
  a33=(a50*a33);
  a49=(a21*a49);
  a33=(a33-a49);
  a47=(a47-a33);
  a47=(a39*a47);
  a80=(a80-a47);
  a80=(a80/a54);
  a47=(a36*a80);
  a47=(a4*a47);
  a83=(a83+a47);
  a79=(a16*a79);
  a47=(a38*a80);
  a47=(a47+a84);
  a47=(a13*a47);
  a79=(a79+a47);
  a47=(a59*a79);
  a84=(a62*a47);
  a33=(a5*a74);
  a33=(a55*a33);
  a67=(a67*a33);
  a49=(a61*a67);
  a80=(a59*a80);
  a11=(a12*a80);
  a49=(a49-a11);
  a11=(a48*a49);
  a84=(a84+a11);
  a11=(a48*a49);
  a82=(a62*a47);
  a11=(a11+a82);
  a11=(a0+a11);
  a82=(a13*a11);
  a14=(a62*a47);
  a49=(a48*a49);
  a14=(a14+a49);
  a49=(a16*a14);
  a82=(a82-a49);
  a84=(a84+a82);
  a84=(a58*a84);
  a78=(a78*a33);
  a33=(a66*a78);
  a84=(a84-a33);
  a33=(a71*a67);
  a82=(a70*a47);
  a49=(a61*a78);
  a80=(a58*a80);
  a49=(a49+a80);
  a80=(a49+a47);
  a80=(a48*a80);
  a82=(a82-a80);
  a47=(a63*a47);
  a49=(a48*a49);
  a47=(a47-a49);
  a82=(a82-a47);
  a82=(a12*a82);
  a33=(a33+a82);
  a84=(a84-a33);
  a84=(a84/a73);
  a77=(a77*a67);
  a33=(a16*a78);
  a33=(a58*a33);
  a82=(a72*a78);
  a33=(a33+a82);
  a77=(a77-a33);
  a68=(a68*a77);
  a84=(a84+a68);
  a68=(a16*a67);
  a68=(a58*a68);
  a33=(a75*a78);
  a68=(a68-a33);
  a33=(a58*a67);
  a82=(a12*a78);
  a33=(a33-a82);
  a68=(a68-a33);
  a68=(a68/a73);
  a81=(a81*a77);
  a68=(a68-a81);
  a68=(a31*a68);
  a84=(a84+a68);
  a68=(a2*a84);
  a83=(a83+a68);
  a83=(a3*a83);
  a83=(a2*a83);
  a83=(-a83);
  if (res[2]!=0) res[2][2]=a83;
  a74=(a5*a74);
  a74=(a4*a74);
  a79=(a36*a79);
  a79=(a4*a79);
  a74=(a74+a79);
  a11=(a16*a11);
  a67=(a31*a67);
  a78=(a45*a78);
  a84=(a58*a84);
  a78=(a78+a84);
  a67=(a67-a78);
  a67=(a67-a14);
  a67=(a13*a67);
  a11=(a11-a67);
  a11=(a2*a11);
  a74=(a74+a11);
  a74=(a3*a74);
  a74=(a2*a74);
  if (res[2]!=0) res[2][3]=a74;
  if (res[3]!=0) res[3][0]=a1;
  if (res[3]!=0) res[3][1]=a1;
  a1=cos(a6);
  a74=(a9*a1);
  a11=(a8*a74);
  a67=(a8*a74);
  a14=(a13*a67);
  a74=(a8*a74);
  a78=(a16*a74);
  a14=(a14-a78);
  a11=(a11+a14);
  a11=(a7*a11);
  a14=sin(a6);
  a18=(a18*a14);
  a11=(a11-a18);
  a25=(a25*a1);
  a11=(a11-a25);
  a11=(a11/a28);
  a30=(a30/a28);
  a25=(a15+a15);
  a25=(a25*a1);
  a18=(a16*a14);
  a18=(a7*a18);
  a27=(a27*a14);
  a18=(a18+a27);
  a25=(a25-a18);
  a30=(a30*a25);
  a11=(a11+a30);
  a30=(a16*a1);
  a30=(a7*a30);
  a34=(a34*a14);
  a30=(a30-a34);
  a34=casadi_sq(a7);
  a18=casadi_sq(a15);
  a34=(a34-a18);
  a30=(a30-a34);
  a30=(a30/a28);
  a35=(a35/a28);
  a35=(a35*a25);
  a30=(a30-a35);
  a30=(a31*a30);
  a11=(a11+a30);
  a67=(a16*a67);
  a1=(a31*a1);
  a41=(a41*a14);
  a14=(a7*a11);
  a41=(a41+a14);
  a1=(a1-a41);
  a1=(a1-a74);
  a1=(a13*a1);
  a67=(a67-a1);
  a1=(a40*a67);
  a74=(a43*a1);
  a41=cos(a37);
  a14=(a42*a41);
  a30=(a40*a11);
  a35=(a39*a30);
  a14=(a14-a35);
  a35=(a21*a14);
  a74=(a74+a35);
  a35=(a21*a14);
  a25=(a43*a1);
  a35=(a35+a25);
  a25=(a13*a35);
  a34=(a43*a1);
  a14=(a21*a14);
  a34=(a34+a14);
  a14=(a16*a34);
  a25=(a25-a14);
  a74=(a74+a25);
  a74=(a38*a74);
  a25=sin(a37);
  a14=(a46*a25);
  a74=(a74-a14);
  a14=(a52*a41);
  a18=(a51*a1);
  a27=(a42*a25);
  a30=(a38*a30);
  a27=(a27+a30);
  a30=(a27+a1);
  a30=(a21*a30);
  a18=(a18-a30);
  a1=(a50*a1);
  a27=(a21*a27);
  a1=(a1-a27);
  a18=(a18-a1);
  a18=(a39*a18);
  a14=(a14+a18);
  a74=(a74-a14);
  a74=(a74/a54);
  a14=(a10/a54);
  a18=(a39+a39);
  a18=(a18*a41);
  a1=(a16*a25);
  a1=(a38*a1);
  a27=(a53*a25);
  a1=(a1+a27);
  a18=(a18-a1);
  a14=(a14*a18);
  a74=(a74+a14);
  a14=(a16*a41);
  a14=(a38*a14);
  a1=(a56*a25);
  a14=(a14-a1);
  a1=casadi_sq(a38);
  a27=casadi_sq(a39);
  a1=(a1-a27);
  a14=(a14-a1);
  a14=(a14/a54);
  a1=(a57/a54);
  a1=(a1*a18);
  a14=(a14-a1);
  a14=(a31*a14);
  a74=(a74+a14);
  a14=(a4*a74);
  a11=(a11+a14);
  a35=(a16*a35);
  a41=(a31*a41);
  a25=(a60*a25);
  a14=(a38*a74);
  a25=(a25+a14);
  a41=(a41-a25);
  a41=(a41-a34);
  a41=(a13*a41);
  a35=(a35-a41);
  a41=(a59*a35);
  a34=(a62*a41);
  a25=cos(a20);
  a14=(a5*a67);
  a14=(a55*a14);
  a14=(a0+a14);
  a25=(a25*a14);
  a1=(a61*a25);
  a74=(a59*a74);
  a18=(a12*a74);
  a1=(a1-a18);
  a18=(a48*a1);
  a34=(a34+a18);
  a18=(a48*a1);
  a27=(a62*a41);
  a18=(a18+a27);
  a27=(a13*a18);
  a30=(a62*a41);
  a1=(a48*a1);
  a30=(a30+a1);
  a1=(a16*a30);
  a27=(a27-a1);
  a34=(a34+a27);
  a34=(a58*a34);
  a27=sin(a20);
  a27=(a27*a14);
  a14=(a66*a27);
  a34=(a34-a14);
  a14=(a71*a25);
  a1=(a70*a41);
  a78=(a61*a27);
  a74=(a58*a74);
  a78=(a78+a74);
  a74=(a78+a41);
  a74=(a48*a74);
  a1=(a1-a74);
  a41=(a63*a41);
  a78=(a48*a78);
  a41=(a41-a78);
  a1=(a1-a41);
  a1=(a12*a1);
  a14=(a14+a1);
  a34=(a34-a14);
  a34=(a34/a73);
  a14=(a22/a73);
  a1=(a12+a12);
  a1=(a1*a25);
  a41=(a16*a27);
  a41=(a58*a41);
  a78=(a72*a27);
  a41=(a41+a78);
  a1=(a1-a41);
  a14=(a14*a1);
  a34=(a34+a14);
  a14=(a16*a25);
  a14=(a58*a14);
  a41=(a75*a27);
  a14=(a14-a41);
  a41=(a58*a25);
  a78=(a12*a27);
  a41=(a41-a78);
  a14=(a14-a41);
  a14=(a14/a73);
  a41=(a76/a73);
  a41=(a41*a1);
  a14=(a14-a41);
  a14=(a31*a14);
  a34=(a34+a14);
  a14=(a4*a34);
  a11=(a11+a14);
  a44=(a36*a44);
  a44=(a8+a44);
  a44=(a2*a44);
  a6=(a6+a44);
  a44=cos(a6);
  a14=sin(a6);
  a41=(a2*a45);
  a9=(a9+a41);
  a41=(a14*a9);
  a18=(a16*a18);
  a25=(a31*a25);
  a27=(a45*a27);
  a1=(a58*a34);
  a27=(a27+a1);
  a25=(a25-a27);
  a25=(a25-a30);
  a25=(a13*a25);
  a18=(a18-a25);
  a25=(a2*a18);
  a30=(a41*a25);
  a64=(a16*a64);
  a27=(a58*a45);
  a1=(a31*a12);
  a27=(a27+a1);
  a27=(a27-a69);
  a27=(a13*a27);
  a64=(a64-a27);
  a64=(a2*a64);
  a64=(a8+a64);
  a27=cos(a6);
  a69=(a36*a35);
  a69=(a2*a69);
  a69=(a0+a69);
  a27=(a27*a69);
  a1=(a9*a27);
  a34=(a2*a34);
  a78=(a14*a34);
  a1=(a1-a78);
  a78=(a64*a1);
  a30=(a30+a78);
  a78=(a64*a1);
  a74=(a41*a25);
  a78=(a78+a74);
  a74=(a13*a78);
  a84=(a41*a25);
  a1=(a64*a1);
  a84=(a84+a1);
  a1=(a16*a84);
  a74=(a74-a1);
  a30=(a30+a74);
  a30=(a44*a30);
  a74=(a64*a41);
  a1=(a41*a64);
  a19=(a19+a1);
  a19=(a13*a19);
  a1=(a64*a41);
  a1=(a16*a1);
  a19=(a19-a1);
  a74=(a74+a19);
  a19=sin(a6);
  a19=(a19*a69);
  a69=(a74*a19);
  a30=(a30-a69);
  a69=(a44*a9);
  a1=(a69-a64);
  a79=(a64*a1);
  a83=(a64*a69);
  a79=(a79-a83);
  a83=(a79*a27);
  a68=(a1*a25);
  a81=(a9*a19);
  a34=(a44*a34);
  a81=(a81+a34);
  a34=(a81+a25);
  a34=(a64*a34);
  a68=(a68-a34);
  a25=(a69*a25);
  a81=(a64*a81);
  a25=(a25-a81);
  a68=(a68-a25);
  a68=(a14*a68);
  a83=(a83+a68);
  a30=(a30-a83);
  a83=(a16*a44);
  a68=(a83*a44);
  a25=casadi_sq(a14);
  a68=(a68+a25);
  a26=(a26+a68);
  a30=(a30/a26);
  a68=(a44*a74);
  a25=(a14*a79);
  a68=(a68-a25);
  a29=(a29-a68);
  a29=(a29/a26);
  a68=(a29/a26);
  a25=(a14+a14);
  a25=(a25*a27);
  a81=(a16*a19);
  a81=(a44*a81);
  a34=(a83*a19);
  a81=(a81+a34);
  a25=(a25-a81);
  a68=(a68*a25);
  a30=(a30+a68);
  a68=(a16*a27);
  a68=(a44*a68);
  a81=(a16*a14);
  a34=(a81*a19);
  a68=(a68-a34);
  a34=(a44*a27);
  a77=(a14*a19);
  a34=(a34-a77);
  a68=(a68-a34);
  a68=(a68/a26);
  a34=(a81*a44);
  a77=(a44*a14);
  a34=(a34-a77);
  a34=(a34/a26);
  a77=(a34/a26);
  a77=(a77*a25);
  a68=(a68-a77);
  a68=(a31*a68);
  a30=(a30+a68);
  a11=(a11+a30);
  a11=(a3*a11);
  a11=(a2*a11);
  a11=(-a11);
  if (res[3]!=0) res[3][2]=a11;
  a35=(a4*a35);
  a67=(a67+a35);
  a18=(a4*a18);
  a67=(a67+a18);
  a78=(a16*a78);
  a27=(a31*a27);
  a18=(a31*a34);
  a18=(a29-a18);
  a19=(a18*a19);
  a30=(a44*a30);
  a19=(a19+a30);
  a27=(a27-a19);
  a27=(a27-a84);
  a27=(a13*a27);
  a78=(a78-a27);
  a67=(a67+a78);
  a67=(a3*a67);
  a67=(a2*a67);
  if (res[3]!=0) res[3][3]=a67;
  a67=(a8*a15);
  a78=(a8*a15);
  a27=(a13*a78);
  a84=(a8*a15);
  a19=(a16*a84);
  a27=(a27-a19);
  a67=(a67+a27);
  a67=(a7*a67);
  a67=(a67/a28);
  a78=(a16*a78);
  a27=(a7*a67);
  a27=(a27+a84);
  a27=(a13*a27);
  a78=(a78+a27);
  a27=(a40*a78);
  a84=(a43*a27);
  a19=(a40*a67);
  a19=(a0-a19);
  a30=(a39*a19);
  a35=(a21*a30);
  a84=(a84+a35);
  a35=(a21*a30);
  a11=(a43*a27);
  a35=(a35+a11);
  a11=(a13*a35);
  a68=(a43*a27);
  a30=(a21*a30);
  a68=(a68+a30);
  a30=(a16*a68);
  a11=(a11-a30);
  a84=(a84+a11);
  a84=(a38*a84);
  a11=(a51*a27);
  a19=(a38*a19);
  a30=(a19-a27);
  a30=(a21*a30);
  a11=(a11+a30);
  a27=(a50*a27);
  a19=(a21*a19);
  a27=(a27+a19);
  a11=(a11-a27);
  a11=(a39*a11);
  a84=(a84-a11);
  a84=(a84/a54);
  a11=(a4*a84);
  a67=(a67+a11);
  a35=(a16*a35);
  a11=(a38*a84);
  a11=(a11+a68);
  a11=(a13*a11);
  a35=(a35+a11);
  a11=(a59*a35);
  a68=(a62*a11);
  a27=cos(a20);
  a19=(a5*a78);
  a19=(a55*a19);
  a30=(a27*a19);
  a77=(a61*a30);
  a84=(a59*a84);
  a84=(a0-a84);
  a25=(a12*a84);
  a77=(a77+a25);
  a25=(a48*a77);
  a68=(a68+a25);
  a25=(a48*a77);
  a33=(a62*a11);
  a25=(a25+a33);
  a33=(a13*a25);
  a82=(a62*a11);
  a77=(a48*a77);
  a82=(a82+a77);
  a77=(a16*a82);
  a33=(a33-a77);
  a68=(a68+a33);
  a68=(a58*a68);
  a33=sin(a20);
  a19=(a33*a19);
  a77=(a66*a19);
  a68=(a68-a77);
  a77=(a71*a30);
  a47=(a70*a11);
  a84=(a58*a84);
  a49=(a61*a19);
  a84=(a84-a49);
  a49=(a84-a11);
  a49=(a48*a49);
  a47=(a47+a49);
  a11=(a63*a11);
  a84=(a48*a84);
  a11=(a11+a84);
  a47=(a47-a11);
  a47=(a12*a47);
  a77=(a77+a47);
  a68=(a68-a77);
  a68=(a68/a73);
  a77=(a22/a73);
  a47=(a12+a12);
  a11=(a47*a30);
  a84=(a16*a19);
  a84=(a58*a84);
  a49=(a72*a19);
  a84=(a84+a49);
  a11=(a11-a84);
  a84=(a77*a11);
  a68=(a68+a84);
  a84=(a16*a30);
  a84=(a58*a84);
  a49=(a75*a19);
  a84=(a84-a49);
  a49=(a58*a30);
  a80=(a12*a19);
  a49=(a49-a80);
  a84=(a84-a49);
  a84=(a84/a73);
  a49=(a76/a73);
  a11=(a49*a11);
  a84=(a84-a11);
  a84=(a31*a84);
  a68=(a68+a84);
  a84=(a4*a68);
  a67=(a67+a84);
  a25=(a16*a25);
  a30=(a31*a30);
  a19=(a45*a19);
  a84=(a58*a68);
  a19=(a19+a84);
  a30=(a30-a19);
  a30=(a30-a82);
  a30=(a13*a30);
  a25=(a25-a30);
  a30=(a2*a25);
  a82=(a41*a30);
  a19=cos(a6);
  a84=(a36*a35);
  a84=(a2*a84);
  a11=(a19*a84);
  a80=(a9*a11);
  a68=(a2*a68);
  a68=(a0-a68);
  a65=(a14*a68);
  a80=(a80+a65);
  a65=(a64*a80);
  a82=(a82+a65);
  a65=(a64*a80);
  a85=(a41*a30);
  a65=(a65+a85);
  a85=(a13*a65);
  a86=(a41*a30);
  a80=(a64*a80);
  a86=(a86+a80);
  a80=(a16*a86);
  a85=(a85-a80);
  a82=(a82+a85);
  a82=(a44*a82);
  a85=sin(a6);
  a84=(a85*a84);
  a80=(a74*a84);
  a82=(a82-a80);
  a80=(a79*a11);
  a87=(a1*a30);
  a68=(a44*a68);
  a88=(a9*a84);
  a68=(a68-a88);
  a88=(a68-a30);
  a88=(a64*a88);
  a87=(a87+a88);
  a30=(a69*a30);
  a68=(a64*a68);
  a30=(a30+a68);
  a87=(a87-a30);
  a87=(a14*a87);
  a80=(a80+a87);
  a82=(a82-a80);
  a82=(a82/a26);
  a80=(a29/a26);
  a87=(a14+a14);
  a30=(a87*a11);
  a68=(a16*a84);
  a68=(a44*a68);
  a88=(a83*a84);
  a68=(a68+a88);
  a30=(a30-a68);
  a68=(a80*a30);
  a82=(a82+a68);
  a68=(a16*a11);
  a68=(a44*a68);
  a88=(a81*a84);
  a68=(a68-a88);
  a88=(a44*a11);
  a89=(a14*a84);
  a88=(a88-a89);
  a68=(a68-a88);
  a68=(a68/a26);
  a88=(a34/a26);
  a30=(a88*a30);
  a68=(a68-a30);
  a68=(a31*a68);
  a82=(a82+a68);
  a67=(a67+a82);
  a67=(a3*a67);
  a67=(a2*a67);
  a67=(a0-a67);
  if (res[4]!=0) res[4][0]=a67;
  a35=(a4*a35);
  a78=(a78+a35);
  a25=(a4*a25);
  a78=(a78+a25);
  a65=(a16*a65);
  a11=(a31*a11);
  a84=(a18*a84);
  a82=(a44*a82);
  a84=(a84+a82);
  a11=(a11-a84);
  a11=(a11-a86);
  a11=(a13*a11);
  a65=(a65-a11);
  a78=(a78+a65);
  a78=(a3*a78);
  a78=(a2*a78);
  if (res[4]!=0) res[4][1]=a78;
  a78=(a13*a17);
  a65=(a16*a17);
  a78=(a78-a65);
  a78=(a17+a78);
  a78=(a7*a78);
  a24=(a24-a8);
  a24=(a24-a23);
  a15=(a15*a24);
  a78=(a78-a15);
  a78=(a78/a28);
  a15=(a16*a17);
  a24=(a7*a78);
  a24=(a24+a17);
  a24=(a13*a24);
  a15=(a15+a24);
  a24=(a40*a15);
  a24=(a0+a24);
  a17=(a43*a24);
  a23=cos(a37);
  a23=(a23*a32);
  a8=(a42*a23);
  a65=(a40*a78);
  a11=(a39*a65);
  a8=(a8-a11);
  a11=(a21*a8);
  a17=(a17+a11);
  a11=(a21*a8);
  a86=(a43*a24);
  a11=(a11+a86);
  a86=(a13*a11);
  a84=(a43*a24);
  a8=(a21*a8);
  a84=(a84+a8);
  a8=(a16*a84);
  a86=(a86-a8);
  a17=(a17+a86);
  a17=(a38*a17);
  a37=sin(a37);
  a37=(a37*a32);
  a46=(a46*a37);
  a17=(a17-a46);
  a52=(a52*a23);
  a46=(a51*a24);
  a42=(a42*a37);
  a65=(a38*a65);
  a42=(a42+a65);
  a65=(a42+a24);
  a65=(a21*a65);
  a46=(a46-a65);
  a24=(a50*a24);
  a42=(a21*a42);
  a24=(a24-a42);
  a46=(a46-a24);
  a46=(a39*a46);
  a52=(a52+a46);
  a17=(a17-a52);
  a17=(a17/a54);
  a10=(a10/a54);
  a52=(a39+a39);
  a52=(a52*a23);
  a46=(a16*a37);
  a46=(a38*a46);
  a53=(a53*a37);
  a46=(a46+a53);
  a52=(a52-a46);
  a10=(a10*a52);
  a17=(a17+a10);
  a10=(a16*a23);
  a10=(a38*a10);
  a56=(a56*a37);
  a10=(a10-a56);
  a56=(a38*a23);
  a46=(a39*a37);
  a56=(a56-a46);
  a10=(a10-a56);
  a10=(a10/a54);
  a57=(a57/a54);
  a57=(a57*a52);
  a10=(a10-a57);
  a10=(a31*a10);
  a17=(a17+a10);
  a10=(a4*a17);
  a78=(a78+a10);
  a11=(a16*a11);
  a23=(a31*a23);
  a60=(a60*a37);
  a37=(a38*a17);
  a60=(a60+a37);
  a23=(a23-a60);
  a23=(a23-a84);
  a23=(a13*a23);
  a11=(a11-a23);
  a23=(a59*a11);
  a23=(a0+a23);
  a84=(a62*a23);
  a60=(a5*a15);
  a60=(a0+a60);
  a60=(a55*a60);
  a27=(a27*a60);
  a37=(a61*a27);
  a17=(a59*a17);
  a10=(a12*a17);
  a37=(a37-a10);
  a10=(a48*a37);
  a84=(a84+a10);
  a10=(a48*a37);
  a57=(a62*a23);
  a10=(a10+a57);
  a57=(a13*a10);
  a52=(a62*a23);
  a37=(a48*a37);
  a52=(a52+a37);
  a37=(a16*a52);
  a57=(a57-a37);
  a84=(a84+a57);
  a84=(a58*a84);
  a33=(a33*a60);
  a60=(a66*a33);
  a84=(a84-a60);
  a60=(a71*a27);
  a57=(a70*a23);
  a37=(a61*a33);
  a17=(a58*a17);
  a37=(a37+a17);
  a17=(a37+a23);
  a17=(a48*a17);
  a57=(a57-a17);
  a23=(a63*a23);
  a37=(a48*a37);
  a23=(a23-a37);
  a57=(a57-a23);
  a57=(a12*a57);
  a60=(a60+a57);
  a84=(a84-a60);
  a84=(a84/a73);
  a47=(a47*a27);
  a60=(a16*a33);
  a60=(a58*a60);
  a57=(a72*a33);
  a60=(a60+a57);
  a47=(a47-a60);
  a77=(a77*a47);
  a84=(a84+a77);
  a77=(a16*a27);
  a77=(a58*a77);
  a60=(a75*a33);
  a77=(a77-a60);
  a60=(a58*a27);
  a57=(a12*a33);
  a60=(a60-a57);
  a77=(a77-a60);
  a77=(a77/a73);
  a49=(a49*a47);
  a77=(a77-a49);
  a77=(a31*a77);
  a84=(a84+a77);
  a77=(a4*a84);
  a78=(a78+a77);
  a10=(a16*a10);
  a27=(a31*a27);
  a33=(a45*a33);
  a77=(a58*a84);
  a33=(a33+a77);
  a27=(a27-a33);
  a27=(a27-a52);
  a27=(a13*a27);
  a10=(a10-a27);
  a27=(a2*a10);
  a27=(a0+a27);
  a52=(a41*a27);
  a33=(a36*a11);
  a33=(a0+a33);
  a33=(a2*a33);
  a19=(a19*a33);
  a77=(a9*a19);
  a84=(a2*a84);
  a49=(a14*a84);
  a77=(a77-a49);
  a49=(a64*a77);
  a52=(a52+a49);
  a49=(a64*a77);
  a47=(a41*a27);
  a49=(a49+a47);
  a47=(a13*a49);
  a60=(a41*a27);
  a77=(a64*a77);
  a60=(a60+a77);
  a77=(a16*a60);
  a47=(a47-a77);
  a52=(a52+a47);
  a52=(a44*a52);
  a85=(a85*a33);
  a33=(a74*a85);
  a52=(a52-a33);
  a33=(a79*a19);
  a47=(a1*a27);
  a77=(a9*a85);
  a84=(a44*a84);
  a77=(a77+a84);
  a84=(a77+a27);
  a84=(a64*a84);
  a47=(a47-a84);
  a27=(a69*a27);
  a77=(a64*a77);
  a27=(a27-a77);
  a47=(a47-a27);
  a47=(a14*a47);
  a33=(a33+a47);
  a52=(a52-a33);
  a52=(a52/a26);
  a87=(a87*a19);
  a33=(a16*a85);
  a33=(a44*a33);
  a47=(a83*a85);
  a33=(a33+a47);
  a87=(a87-a33);
  a80=(a80*a87);
  a52=(a52+a80);
  a80=(a16*a19);
  a80=(a44*a80);
  a33=(a81*a85);
  a80=(a80-a33);
  a33=(a44*a19);
  a47=(a14*a85);
  a33=(a33-a47);
  a80=(a80-a33);
  a80=(a80/a26);
  a88=(a88*a87);
  a80=(a80-a88);
  a80=(a31*a80);
  a52=(a52+a80);
  a78=(a78+a52);
  a78=(a3*a78);
  a78=(a2*a78);
  a78=(-a78);
  if (res[4]!=0) res[4][2]=a78;
  a11=(a4*a11);
  a15=(a15+a11);
  a10=(a4*a10);
  a15=(a15+a10);
  a49=(a16*a49);
  a19=(a31*a19);
  a85=(a18*a85);
  a52=(a44*a52);
  a85=(a85+a52);
  a19=(a19-a85);
  a19=(a19-a60);
  a19=(a13*a19);
  a49=(a49-a19);
  a15=(a15+a49);
  a15=(a3*a15);
  a15=(a2*a15);
  a15=(a0+a15);
  if (res[4]!=0) res[4][3]=a15;
  a15=(1./a28);
  a49=(a40/a28);
  a19=(a39*a49);
  a60=(a21*a19);
  a85=(a7/a28);
  a85=(a13*a85);
  a52=(a40*a85);
  a10=(a43*a52);
  a60=(a60-a10);
  a10=(a21*a19);
  a11=(a43*a52);
  a10=(a10-a11);
  a11=(a13*a10);
  a19=(a21*a19);
  a78=(a43*a52);
  a19=(a19-a78);
  a78=(a16*a19);
  a11=(a11-a78);
  a60=(a60+a11);
  a60=(a38*a60);
  a49=(a38*a49);
  a11=(a49+a52);
  a11=(a21*a11);
  a78=(a51*a52);
  a11=(a11-a78);
  a49=(a21*a49);
  a52=(a50*a52);
  a49=(a49-a52);
  a11=(a11-a49);
  a11=(a39*a11);
  a60=(a60-a11);
  a60=(a0-a60);
  a60=(a60/a54);
  a11=(a4*a60);
  a15=(a15+a11);
  a11=sin(a20);
  a49=(a5*a85);
  a49=(a55*a49);
  a52=(a11*a49);
  a78=(a66*a52);
  a10=(a16*a10);
  a80=(a38*a60);
  a80=(a80-a19);
  a80=(a13*a80);
  a10=(a10-a80);
  a80=(a59*a10);
  a19=(a62*a80);
  a60=(a59*a60);
  a88=(a12*a60);
  a20=cos(a20);
  a49=(a20*a49);
  a87=(a61*a49);
  a88=(a88-a87);
  a87=(a48*a88);
  a19=(a19+a87);
  a87=(a48*a88);
  a33=(a62*a80);
  a87=(a87+a33);
  a33=(a13*a87);
  a47=(a62*a80);
  a88=(a48*a88);
  a47=(a47+a88);
  a88=(a16*a47);
  a33=(a33-a88);
  a19=(a19+a33);
  a19=(a58*a19);
  a78=(a78+a19);
  a19=(a70*a80);
  a33=(a61*a52);
  a60=(a58*a60);
  a33=(a33+a60);
  a60=(a33-a80);
  a60=(a48*a60);
  a19=(a19+a60);
  a80=(a63*a80);
  a33=(a48*a33);
  a80=(a80+a33);
  a19=(a19-a80);
  a19=(a12*a19);
  a80=(a71*a49);
  a19=(a19-a80);
  a78=(a78-a19);
  a78=(a0-a78);
  a78=(a78/a73);
  a22=(a22/a73);
  a19=(a16*a52);
  a19=(a58*a19);
  a80=(a72*a52);
  a19=(a19+a80);
  a80=(a12+a12);
  a33=(a80*a49);
  a19=(a19-a33);
  a33=(a22*a19);
  a78=(a78-a33);
  a33=(a75*a52);
  a60=(a16*a49);
  a60=(a58*a60);
  a33=(a33-a60);
  a60=(a12*a52);
  a88=(a58*a49);
  a60=(a60-a88);
  a33=(a33-a60);
  a33=(a33/a73);
  a76=(a76/a73);
  a19=(a76*a19);
  a33=(a33-a19);
  a33=(a31*a33);
  a78=(a78-a33);
  a33=(a4*a78);
  a15=(a15+a33);
  a87=(a16*a87);
  a52=(a45*a52);
  a33=(a58*a78);
  a52=(a52+a33);
  a49=(a31*a49);
  a52=(a52-a49);
  a52=(a52-a47);
  a52=(a13*a52);
  a87=(a87-a52);
  a52=(a2*a87);
  a47=(a41*a52);
  a49=cos(a6);
  a33=(a36*a10);
  a33=(a2*a33);
  a19=(a49*a33);
  a60=(a9*a19);
  a78=(a2*a78);
  a88=(a14*a78);
  a60=(a60+a88);
  a88=(a64*a60);
  a47=(a47+a88);
  a88=(a64*a60);
  a27=(a41*a52);
  a88=(a88+a27);
  a27=(a13*a88);
  a77=(a41*a52);
  a60=(a64*a60);
  a77=(a77+a60);
  a60=(a16*a77);
  a27=(a27-a60);
  a47=(a47+a27);
  a47=(a44*a47);
  a6=sin(a6);
  a33=(a6*a33);
  a27=(a74*a33);
  a47=(a47-a27);
  a27=(a79*a19);
  a60=(a1*a52);
  a78=(a44*a78);
  a84=(a9*a33);
  a78=(a78-a84);
  a84=(a78-a52);
  a84=(a64*a84);
  a60=(a60+a84);
  a52=(a69*a52);
  a78=(a64*a78);
  a52=(a52+a78);
  a60=(a60-a52);
  a60=(a14*a60);
  a27=(a27+a60);
  a47=(a47-a27);
  a47=(a0-a47);
  a47=(a47/a26);
  a29=(a29/a26);
  a27=(a14+a14);
  a60=(a27*a19);
  a52=(a16*a33);
  a52=(a44*a52);
  a78=(a83*a33);
  a52=(a52+a78);
  a60=(a60-a52);
  a52=(a29*a60);
  a47=(a47-a52);
  a52=(a16*a19);
  a52=(a44*a52);
  a78=(a81*a33);
  a52=(a52-a78);
  a78=(a44*a19);
  a84=(a14*a33);
  a78=(a78-a84);
  a52=(a52-a78);
  a52=(a52/a26);
  a34=(a34/a26);
  a60=(a34*a60);
  a52=(a52-a60);
  a52=(a31*a52);
  a47=(a47-a52);
  a15=(a15+a47);
  a15=(a3*a15);
  a15=(a2*a15);
  if (res[5]!=0) res[5][0]=a15;
  a10=(a4*a10);
  a10=(a10-a85);
  a87=(a4*a87);
  a10=(a10+a87);
  a88=(a16*a88);
  a47=(a44*a47);
  a33=(a18*a33);
  a47=(a47-a33);
  a19=(a31*a19);
  a47=(a47+a19);
  a47=(a47-a77);
  a47=(a13*a47);
  a88=(a88-a47);
  a10=(a10+a88);
  a10=(a3*a10);
  a10=(a2*a10);
  if (res[5]!=0) res[5][1]=a10;
  a10=(a13*a7);
  a10=(a10/a28);
  a7=(a7*a10);
  a7=(a13*a7);
  a7=(a16+a7);
  a28=(a40*a7);
  a88=(a43*a28);
  a40=(a40*a10);
  a47=(a39*a40);
  a77=(a21*a47);
  a88=(a88-a77);
  a77=(a43*a28);
  a19=(a21*a47);
  a77=(a77-a19);
  a77=(a0+a77);
  a19=(a13*a77);
  a43=(a43*a28);
  a47=(a21*a47);
  a43=(a43-a47);
  a47=(a16*a43);
  a19=(a19-a47);
  a88=(a88+a19);
  a88=(a38*a88);
  a51=(a51*a28);
  a40=(a38*a40);
  a19=(a40+a28);
  a19=(a21*a19);
  a51=(a51-a19);
  a50=(a50*a28);
  a21=(a21*a40);
  a50=(a50-a21);
  a51=(a51-a50);
  a39=(a39*a51);
  a88=(a88-a39);
  a88=(a88/a54);
  a54=(a4*a88);
  a10=(a10+a54);
  a77=(a16*a77);
  a38=(a38*a88);
  a38=(a38+a43);
  a38=(a13*a38);
  a77=(a77+a38);
  a38=(a59*a77);
  a43=(a62*a38);
  a5=(a5*a7);
  a55=(a55*a5);
  a20=(a20*a55);
  a5=(a61*a20);
  a59=(a59*a88);
  a88=(a12*a59);
  a5=(a5-a88);
  a88=(a48*a5);
  a43=(a43+a88);
  a88=(a48*a5);
  a54=(a62*a38);
  a88=(a88+a54);
  a88=(a0+a88);
  a54=(a13*a88);
  a62=(a62*a38);
  a5=(a48*a5);
  a62=(a62+a5);
  a5=(a16*a62);
  a54=(a54-a5);
  a43=(a43+a54);
  a43=(a58*a43);
  a11=(a11*a55);
  a66=(a66*a11);
  a43=(a43-a66);
  a71=(a71*a20);
  a70=(a70*a38);
  a61=(a61*a11);
  a59=(a58*a59);
  a61=(a61+a59);
  a59=(a61+a38);
  a59=(a48*a59);
  a70=(a70-a59);
  a63=(a63*a38);
  a48=(a48*a61);
  a63=(a63-a48);
  a70=(a70-a63);
  a70=(a12*a70);
  a71=(a71+a70);
  a43=(a43-a71);
  a43=(a43/a73);
  a80=(a80*a20);
  a71=(a16*a11);
  a71=(a58*a71);
  a72=(a72*a11);
  a71=(a71+a72);
  a80=(a80-a71);
  a22=(a22*a80);
  a43=(a43+a22);
  a22=(a16*a20);
  a22=(a58*a22);
  a75=(a75*a11);
  a22=(a22-a75);
  a75=(a58*a20);
  a12=(a12*a11);
  a75=(a75-a12);
  a22=(a22-a75);
  a22=(a22/a73);
  a76=(a76*a80);
  a22=(a22-a76);
  a22=(a31*a22);
  a43=(a43+a22);
  a22=(a4*a43);
  a10=(a10+a22);
  a88=(a16*a88);
  a20=(a31*a20);
  a45=(a45*a11);
  a58=(a58*a43);
  a45=(a45+a58);
  a20=(a20-a45);
  a20=(a20-a62);
  a20=(a13*a20);
  a88=(a88-a20);
  a20=(a2*a88);
  a62=(a41*a20);
  a36=(a36*a77);
  a36=(a2*a36);
  a49=(a49*a36);
  a45=(a9*a49);
  a43=(a2*a43);
  a58=(a14*a43);
  a45=(a45-a58);
  a58=(a64*a45);
  a62=(a62+a58);
  a58=(a64*a45);
  a11=(a41*a20);
  a58=(a58+a11);
  a0=(a0+a58);
  a58=(a13*a0);
  a41=(a41*a20);
  a45=(a64*a45);
  a41=(a41+a45);
  a45=(a16*a41);
  a58=(a58-a45);
  a62=(a62+a58);
  a62=(a44*a62);
  a6=(a6*a36);
  a74=(a74*a6);
  a62=(a62-a74);
  a79=(a79*a49);
  a1=(a1*a20);
  a9=(a9*a6);
  a43=(a44*a43);
  a9=(a9+a43);
  a43=(a9+a20);
  a43=(a64*a43);
  a1=(a1-a43);
  a69=(a69*a20);
  a64=(a64*a9);
  a69=(a69-a64);
  a1=(a1-a69);
  a1=(a14*a1);
  a79=(a79+a1);
  a62=(a62-a79);
  a62=(a62/a26);
  a27=(a27*a49);
  a79=(a16*a6);
  a79=(a44*a79);
  a83=(a83*a6);
  a79=(a79+a83);
  a27=(a27-a79);
  a29=(a29*a27);
  a62=(a62+a29);
  a29=(a16*a49);
  a29=(a44*a29);
  a81=(a81*a6);
  a29=(a29-a81);
  a81=(a44*a49);
  a14=(a14*a6);
  a81=(a81-a14);
  a29=(a29-a81);
  a29=(a29/a26);
  a34=(a34*a27);
  a29=(a29-a34);
  a29=(a31*a29);
  a62=(a62+a29);
  a10=(a10+a62);
  a10=(a3*a10);
  a10=(a2*a10);
  a10=(-a10);
  if (res[5]!=0) res[5][2]=a10;
  a77=(a4*a77);
  a7=(a7+a77);
  a4=(a4*a88);
  a7=(a7+a4);
  a16=(a16*a0);
  a31=(a31*a49);
  a18=(a18*a6);
  a44=(a44*a62);
  a18=(a18+a44);
  a31=(a31-a18);
  a31=(a31-a41);
  a13=(a13*a31);
  a16=(a16-a13);
  a7=(a7+a16);
  a3=(a3*a7);
  a2=(a2*a3);
  if (res[5]!=0) res[5][3]=a2;
}

// Multi-threaded GPU code
template <typename scalar_t>
__global__ void dynamics_kernel_gpu(const scalar_t *q_in_ptr, const scalar_t *qdot_in_ptr, const scalar_t *tau_in_ptr, const scalar_t *h_in_ptr,
                                    scalar_t *q_out_ptr, scalar_t *qdot_out_ptr,
                                    int q_size, int num_threads)
{
  GPU_1D_KERNEL_LOOP(b, num_threads)
  {
    _dynamics_gpu(q_in_ptr + b * q_size, qdot_in_ptr + b * q_size, tau_in_ptr + b * q_size, h_in_ptr + b,
                  q_out_ptr + b * q_size, qdot_out_ptr + b * q_size);
  }
}

template <typename scalar_t>
__global__ void derivatives_kernel_gpu(const scalar_t *q_in_ptr, const scalar_t *qdot_in_ptr, const scalar_t *tau_in_ptr, const scalar_t *h_in_ptr,
                                       scalar_t *q_jac_q_ptr, scalar_t *q_jac_qdot_ptr, scalar_t *q_jac_tau_ptr,
                                       scalar_t *qdot_jac_q_ptr, scalar_t *qdot_jac_qdot_ptr, scalar_t *qdot_jac_tau_ptr,
                                       int q_size, int num_threads)
{
  GPU_1D_KERNEL_LOOP(b, num_threads)
  {
    _derivatives_gpu(q_in_ptr + b * q_size, qdot_in_ptr + b * q_size, tau_in_ptr + b * q_size, h_in_ptr + b,
                     q_jac_q_ptr + b * q_size * q_size, q_jac_qdot_ptr + b * q_size * q_size, q_jac_tau_ptr + b * q_size * q_size,
                     qdot_jac_q_ptr + b * q_size * q_size, qdot_jac_qdot_ptr + b * q_size * q_size, qdot_jac_tau_ptr + b * q_size * q_size);
  }
}

// Torch CPU wrapper
std::vector<torch::Tensor> dynamics_gpu(torch::Tensor q_in, torch::Tensor qdot_in, torch::Tensor tau_in, torch::Tensor h_in)
{
  int batch_size = q_in.size(0);
  int q_size = q_in.size(1);
  torch::Tensor q_out = torch::zeros_like(q_in);
  torch::Tensor qdot_out = torch::zeros_like(q_in);
  using scalar_t = double;

  dynamics_kernel_gpu<scalar_t><<<NUM_BLOCKS(batch_size), NUM_THREADS>>>(
      q_in.data_ptr<scalar_t>(),
      qdot_in.data_ptr<scalar_t>(),
      tau_in.data_ptr<scalar_t>(),
      h_in.data_ptr<scalar_t>(),
      q_out.data_ptr<scalar_t>(),
      qdot_out.data_ptr<scalar_t>(),
      q_size,
      batch_size);

  return {q_out, qdot_out};
}

std::vector<torch::Tensor> derivatives_gpu(torch::Tensor q_in, torch::Tensor qdot_in, torch::Tensor tau_in, torch::Tensor h_in)
{
  int batch_size = q_in.size(0);
  int q_size = q_in.size(1);
  torch::Tensor q_jac_q = torch::zeros({batch_size, q_size, q_size}, q_in.options());
  torch::Tensor q_jac_qdot = torch::zeros({batch_size, q_size, q_size}, q_in.options());
  torch::Tensor q_jac_tau = torch::zeros({batch_size, q_size, q_size}, q_in.options());
  torch::Tensor qdot_jac_q = torch::zeros({batch_size, q_size, q_size}, q_in.options());
  torch::Tensor qdot_jac_qdot = torch::zeros({batch_size, q_size, q_size}, q_in.options());
  torch::Tensor qdot_jac_tau = torch::zeros({batch_size, q_size, q_size}, q_in.options());
  using scalar_t = double;

  derivatives_kernel_gpu<scalar_t><<<NUM_BLOCKS(batch_size), NUM_THREADS>>>(
      q_in.data_ptr<scalar_t>(),
      qdot_in.data_ptr<scalar_t>(),
      tau_in.data_ptr<scalar_t>(),
      h_in.data_ptr<scalar_t>(),
      q_jac_q.data_ptr<scalar_t>(),
      q_jac_qdot.data_ptr<scalar_t>(),
      q_jac_tau.data_ptr<scalar_t>(),
      qdot_jac_q.data_ptr<scalar_t>(),
      qdot_jac_qdot.data_ptr<scalar_t>(),
      qdot_jac_tau.data_ptr<scalar_t>(),
      q_size,
      batch_size);

  return {q_jac_q, q_jac_qdot, q_jac_tau, qdot_jac_q, qdot_jac_qdot, qdot_jac_tau};
}
