//#include "nanovoid_app.h"
//
//void NanoVoidOneStep::back_grab_vals(uint item, valueType *value_table, valueType *vals)
//{
//    Coordinate2d3c c(0, 0);
//    c.from_item(item, size, size * size);
//
//    for (uint i = 0; i < lap_len_2nd; i++)
//    {
//        Coordinate2d3c cc(c);
//
//        int x = cc.x + dx[i];
//        int y = cc.y + dy[i];
//
//        x = max(x, 0);
//        x = min(x, size - 1);
//        y = max(y, 0);
//        y = min(y, size - 1);
//
//        cc.x = x;
//        cc.y = y;
//
//        uint this_item_c1 = cc.to_item_c1(size, size * size);
//
//        // b here
//        uint pd1 = inv.item2pd[this_item_c1];
//        uint root1 = inv.find_(pd1);
//        uint root_item1 = inv.d_item(root1);
//        vals[i] = value_table[root_item1];
//
//        vals[i + lap_len_2nd] = value_table[root_item1 + num_items];
//
//        vals[i + lap_len_2nd * 2] = value_table[root_item1 + num_items * 2];
//
//        vals[i + lap_len_2nd * 3] = value_table[root_item1 + num_items * 3];
//
//        vals[i + lap_len_2nd * 4] = value_table[root_item1 + num_items * 4];
//
//        vals[i + lap_len_2nd * 5] = value_table[root_item1 + num_items * 5];
//    }
//}
//
//void NanoVoidOneStep::backward_one_step(valueType *vals, uint c, valueType *new_v)
//{
//    valueType energy_v = std::abs(p.energy_v0) + 0.001;
//    valueType energy_i = std::abs(p.energy_i0) + 0.001;
//    valueType kBT = std::abs(p.kBT0) + 0.001;
//    valueType kappa_v = std::abs(p.kappa_v0) + 0.001;
//    valueType kappa_i = std::abs(p.kappa_i0) + 0.001;
//    valueType kappa_eta = std::abs(p.kappa_eta0) + 0.001;
//    valueType r_bulk = std::abs(p.r_bulk0) + 0.001;
//    valueType r_surf = std::abs(p.r_surf0) + 0.001;
//
//    valueType p_casc = std::abs(p.p_casc0) + 0.001;
//    valueType bias = std::abs(p.bias0) + 0.001;
//    valueType vg = std::abs(p.vg0) + 0.001;
//    valueType diff_v = std::abs(p.diff_v0) + 0.001;
//    valueType diff_i = std::abs(p.diff_i0) + 0.001;
//    valueType L = std::abs(p.L0) + 0.001;
//
//    valueType back_vals[this->vals_len];
//    backward_one_step_vals(vals, back_vals);
//    new_v[c] = back_vals[0];                               // should ensure no zero here
//    new_v[c + num_items] = back_vals[lap_len_2nd];         // should ensure no zero here
//    new_v[c + num_items * 2] = back_vals[lap_len_2nd * 2]; // should ensure no zero here
//
//    valueType dt = 2e-2;
//    valueType mv = diff_v * back_vals[0] / kBT; // detect division by zero
//    valueType mi = diff_i * back_vals[lap_len_2nd] / kBT; // detect division by zero
//    valueType Q = dt * mv;
//    valueType P = dt * mi;
//    valueType R = dt * (-L) * N;
//    valueType cv = back_vals[0];
//    valueType ci = back_vals[lap_len_2nd];
//    valueType eta = back_vals[lap_len_2nd * 2];
//
//    if (cv < 1e-6)
//        cv = 1e-6;
//
//    if (ci < 1e-6)
//        ci = 1e-6;
//
//    if (eta < 1e-6)
//        eta = 1e-6;
//
//    valueType back_dloss[this->vals_len];
//
//    valueType one_cv_ci = 1 - cv - ci;
//    if (one_cv_ci < 1e-6)
//        one_cv_ci = 1e-6;
//
//    // compute dloss_dcv
//    //      compute dloss_dcv_dcv_dcv
//    valueType dloss_dcv[lap_len_1st];
//    for (uint i = 0; i < lap_len_1st; ++i)
//    {
//        dloss_dcv[i] = vals[this->vals_len + i];
//    }
//    valueType QlapDlossDcv = Q * inner_product(dloss_dcv, lapw, lap_len_1st);
//    valueType dloss_dcv_dcv_dcv = vals[vals_len] + QlapDlossDcv * ((eta - 1) * (eta - 1) * kBT *
//                                                                       (1 / cv + 1 / one_cv_ci) +
//                                                                   2 * eta * eta);
//    dloss_dcv_dcv_dcv += kappa_v / 2 * Q * Q * inner_product(vals + vals_len, laplapw, lap_len_2nd);
//
//    //      compute dloss_dci_dci_dcv
//    valueType dloss_dci[lap_len_1st];
//    for (uint i = 0; i < lap_len_1st; ++i)
//    {
//        dloss_dci[i] = vals[this->vals_len + lap_len_2nd + i];
//    }
//    valueType PlapDlossDci = P * inner_product(dloss_dci, lapw, lap_len_1st);
//    valueType dloss_dci_dci_dcv = PlapDlossDci * ((eta - 1) * (eta - 1) * kBT *
//                                                  1 / one_cv_ci);
//
//    //      compute dloss_deta_deta_dcv
//    valueType dloss_deta_deta_dcv = R * vals[this->vals_len + lap_len_2nd * 2];
//    dloss_deta_deta_dcv *= (2 * (eta - 1) * (energy_v + kBT * (log_with_mask_single(cv, EPS) - log_with_mask_single(one_cv_ci, EPS))) + 2 * eta * (2 * (cv - 1)));
//
//    // final assign
//    new_v[c + num_items * 3] = dloss_dcv_dcv_dcv + dloss_dci_dci_dcv + dloss_deta_deta_dcv;
//
//    // compute dloss_dci
//    //      compute dloss_dci_dci_dci
//    // valueType PlapDlossDci = P * inner_product(dloss_dci, lapw, lap_len_1st);
//    valueType dloss_dci_dci_dci = vals[vals_len + lap_len_2nd] + PlapDlossDci * ((eta - 1) * (eta - 1) * kBT *
//                                                                                     (1 / ci + 1 / one_cv_ci) +
//                                                                                 2 * eta * eta);
//    dloss_dci_dci_dci += kappa_i / 2 * P * P * inner_product(vals + vals_len + lap_len_2nd, laplapw, lap_len_2nd);
//
//    //      compute dloss_dcv_dcv_dci
//    valueType dloss_dcv_dcv_dci = QlapDlossDcv * ((eta - 1) * (eta - 1) * kBT *
//                                                  1 / one_cv_ci);
//
//    //      compute dloss_deta_deta_dci
//    valueType dloss_deta_deta_dci = R * vals[this->vals_len + lap_len_2nd * 2];
//    dloss_deta_deta_dci *= (2 * (eta - 1) * (energy_i + kBT * (log_with_mask_single(ci, EPS) - log_with_mask_single(one_cv_ci, EPS))) + 2 * eta * 2 * ci);
//
//    // final assign
//    new_v[c + num_items * 4] = dloss_dci_dci_dci + dloss_dcv_dcv_dci + dloss_deta_deta_dci;
//
//    // compute dloss_deta
//    //      compute dloss_dcv_dcv_deta
//    valueType dloss_dcv_dcv_deta = QlapDlossDcv * (2 * (eta - 1) * (energy_v + kBT * (log_with_mask_single(cv, EPS) - log_with_mask_single(one_cv_ci, EPS))) + 2 * eta * 2 * (cv - 1));
//
//    //      compute dloss_dci_dci_deta
//    valueType dloss_dci_dci_deta = PlapDlossDci * (2 * (eta - 1) * (energy_i + kBT * (log_with_mask_single(ci, EPS) - log_with_mask_single(one_cv_ci, EPS))) + 2 * eta * 2 * ci);
//    //      compute dloss_deta_deta_deta
//    valueType dloss_deta[lap_len_1st];
//    for (uint i = 0; i < lap_len_1st; ++i)
//    {
//        dloss_deta[i] = vals[this->vals_len + lap_len_2nd * 2 + i];
//    }
//
//    valueType dloss_deta_deta_deta = vals[vals_len + lap_len_2nd * 2];
//    dloss_deta_deta_deta += R * vals[vals_len + lap_len_2nd * 2] * 2 * (energy_v * cv + energy_i * ci + kBT * (cv * log_with_mask_single(cv, EPS) + ci * log_with_mask_single(ci, EPS) + one_cv_ci * log_with_mask_single(one_cv_ci, EPS)) + (cv - 1) * (cv - 1) + ci * ci);
//
//    dloss_deta_deta_deta -= R * kappa_eta * inner_product(dloss_deta, lapw, lap_len_1st);
//
//    // final assign
//    new_v[c + num_items * 5] = dloss_dcv_dcv_deta + dloss_dci_dci_deta + dloss_deta_deta_deta;
//    if (debug_on) {
//        if (isnan(new_v[c + num_items * 3]) || isnan(new_v[c + num_items * 4]) || isnan(new_v[c + num_items * 5])) {
//            fflush(stdout);
//            cout << "detect nan value" << endl;
//            cout << "vals: ";
//            for (int i = 0; i < back_vals_len; ++i)
//                cout << vals[i] << ", ";
//            cout << endl;
//        }
//    }
//}
//
//// cv_k-1 = cv_k - lap(G)
//void NanoVoidOneStep::backward_one_step_vals(valueType *vals, valueType *new_v)
//{
//    valueType energy_v = std::abs(p.energy_v0) + 0.001;
//    valueType energy_i = std::abs(p.energy_i0) + 0.001;
//    valueType kBT = std::abs(p.kBT0) + 0.001;
//    valueType kappa_v = std::abs(p.kappa_v0) + 0.001;
//    valueType kappa_i = std::abs(p.kappa_i0) + 0.001;
//    valueType kappa_eta = std::abs(p.kappa_eta0) + 0.001;
//    valueType r_bulk = std::abs(p.r_bulk0) + 0.001;
//    valueType r_surf = std::abs(p.r_surf0) + 0.001;
//
//    valueType p_casc = std::abs(p.p_casc0) + 0.001;
//    valueType bias = std::abs(p.bias0) + 0.001;
//    valueType vg = std::abs(p.vg0) + 0.001;
//    valueType diff_v = std::abs(p.diff_v0) + 0.001;
//    valueType diff_i = std::abs(p.diff_i0) + 0.001;
//    valueType L = std::abs(p.L0) + 0.001;
//
//    // compute cv, ci
//    valueType h_dfs_dcv[lap_len_1st];
//    valueType h_dfs_dci[lap_len_1st];
//
//    // construct h_dfs_dcv, h_dfs_dci
//    for (uint i = 0; i < lap_len_1st; i++)
//    {
//        h_dfs_dcv[i] = 1.0;
//        h_dfs_dci[i] = 1.0;
//
//        //        h_dfs_dcv[i] = (vals[lap_len_2nd * 2 + i] - 1) * (vals[lap_len_2nd * 2 + i] - 1); // (eta-1)**2
//        //        h_dfs_dci[i] = h_dfs_dcv[i];
//
//        valueType log_cv = log_with_mask_single(vals[i], EPS);
//        valueType log_ci = log_with_mask_single(vals[lap_len_2nd + i], EPS);
//        valueType log_1_cv_ci = log_with_mask_single(1 - vals[i] - vals[i + lap_len_2nd], EPS);
//
//        h_dfs_dcv[i] = h_dfs_dcv[i] * (energy_v + kBT * (log_cv - log_1_cv_ci));
//        h_dfs_dci[i] = h_dfs_dci[i] * (energy_i + kBT * (log_ci - log_1_cv_ci));
//        if ((1 - vals[i] - vals[i + lap_len_2nd]) < EPS)
//        {
//            h_dfs_dcv[i] = 0;
//            h_dfs_dci[i] = 0;
//        }
//
//        h_dfs_dcv[i] = h_dfs_dcv[i] * (vals[lap_len_2nd * 2 + i] - 1) * (vals[lap_len_2nd * 2 + i] - 1); // (eta-1)**2
//        h_dfs_dci[i] = h_dfs_dci[i] * (vals[lap_len_2nd * 2 + i] - 1) * (vals[lap_len_2nd * 2 + i] - 1);
//    }
//
//    valueType j_dfv_dcv[lap_len_1st];
//    valueType j_dfv_dci[lap_len_1st];
//
//    for (uint i = 0; i < lap_len_1st; i++)
//    {
//        j_dfv_dcv[i] = vals[lap_len_2nd * 2 + i] * vals[lap_len_2nd * 2 + i]; // eta**2
//        j_dfv_dci[i] = j_dfv_dcv[i];
//
//        j_dfv_dcv[i] = j_dfv_dcv[i] * 2 * (vals[i] - 1);
//        j_dfv_dci[i] = j_dfv_dci[i] * 2 * vals[lap_len_2nd + i];
//    }
//
//    valueType dt = 2e-2;
//    valueType mv = diff_v * vals[0] / kBT;
//    valueType mi = diff_i * vals[lap_len_2nd] / kBT;
//
//    valueType dt_mv_lap_h_dfs_dcv = dt * mv * inner_product(h_dfs_dcv, lapw, lap_len_1st);
//    valueType dt_mv_lap_j_dfv_dcv = dt * mv * inner_product(j_dfv_dcv, lapw, lap_len_1st);
//    valueType dt_mv_lap_lap_cv = -dt * mv * inner_product(vals, laplapw, lap_len_2nd);
//
//    new_v[0] = vals[0] - (dt_mv_lap_h_dfs_dcv + dt_mv_lap_j_dfv_dcv + kappa_v * dt_mv_lap_lap_cv);
//
//    valueType dt_mi_lap_h_dfs_dci = dt * mi * inner_product(h_dfs_dci, lapw, lap_len_1st);
//    valueType dt_mi_lap_j_dfv_dci = dt * mi * inner_product(j_dfv_dci, lapw, lap_len_1st);
//    valueType dt_mi_lap_lap_ci = -dt * mi * inner_product(vals + lap_len_2nd, laplapw, lap_len_2nd);
//
//    new_v[0 + lap_len_2nd] = vals[lap_len_2nd] - (dt_mi_lap_h_dfs_dci + dt_mi_lap_j_dfv_dci + kappa_i * dt_mi_lap_lap_ci);
//
//    // compute eta
//    // fs
//    valueType fs = energy_v * vals[0] + energy_i * vals[lap_len_2nd];
//    fs = fs + kBT * (vals[0] * log_with_mask_single(vals[0], EPS));
//    fs = fs + kBT * (vals[lap_len_2nd] * log_with_mask_single(vals[lap_len_2nd], EPS));
//    fs = fs + kBT * ((1 - vals[0] - vals[lap_len_2nd]) * log_with_mask_single(1 - vals[0] - vals[lap_len_2nd], EPS));
//    if ((1 - vals[0] - vals[lap_len_2nd]) < EPS)
//    {
//        fs = 0;
//    }
//    // fv
//    valueType fv = (vals[0] - 1) * (vals[0] - 1) + vals[lap_len_2nd] * vals[lap_len_2nd];
//
//    valueType dF_deta = N * (fs * 2 * (vals[lap_len_2nd * 2] - 1) + fv * 2 * vals[lap_len_2nd * 2] -
//                             kappa_eta * inner_product(vals + lap_len_2nd * 2, lapw, lap_len_1st));
//
//    new_v[0 + lap_len_2nd * 2] = vals[lap_len_2nd * 2] - dt * (-L) * dF_deta;
//
//    if (std::signbit(new_v[0]))
//    {
//        new_v[0] = 1e-6;
//    }
//
//    if (std::signbit(new_v[0 + lap_len_2nd]))
//    {
//        new_v[0 + lap_len_2nd] = 1e-6;
//    }
//
//    if (std::signbit(new_v[0 + lap_len_2nd * 2]))
//    {
//        new_v[0 + lap_len_2nd * 2] = 1e-6;
//    }
//
//    if (new_v[0] >= 1.0)
//    {
//        new_v[0] = 1.0;
//    }
//
//    if (new_v[0 + lap_len_2nd] >= 1.0)
//    {
//        new_v[0 + lap_len_2nd] = 1.0;
//    }
//
//    if (new_v[0 + lap_len_2nd * 2] >= 1.0)
//    {
//        new_v[0 + lap_len_2nd * 2] = 1.0;
//    }
//}
//
//void NanoVoidOneStep::prev()
//{
//    valueType vals[back_vals_len];
//    vector<uint> active_list;
//
//    printf("one-step-eval\n");
//    //check_non_empty_item2hp();
//    // do one step of evaluation
//    vector<list<uint>>::iterator it;
//    for (it = hash_t.l[0].begin(); it != hash_t.l[0].end(); ++it)
//    {
//        list<uint>::iterator itt;
//        for (itt = it->begin(); itt != it->end(); ++itt)
//        {
//            uint p_pnb = hash_t.hp.d[*itt].pnb;
//            back_grab_vals(pnb.d[p_pnb].p_list, old_v, vals);
//            if (debug_on)
//            {
//                fflush(stdout);
//                cout << "vals: ";
//                for (int i = 0; i < back_vals_len; ++i)
//                    cout << vals[i] << ", ";
//                cout << endl;
//            }
//
//            backward_one_step(vals, pnb.d[p_pnb].p_list, new_v);
//            accumulate_weight_derivative(vals, pnb.d[p_pnb].p_list);
//            pnb.d[p_pnb].at_least_one_lsh_changed = false;
//        }
//    }
//    //inv.check_from_dfslist(num_items);
//
//    printf("move hash buckets across different hash_t.l entries\n");
//    //check_non_empty_item2hp();
//    // move hash buckets across different hash_t.l entries
//    int new_lsh_hash_code[K];
//    uint cl = 0;
//    for (cl = 0; cl < L; ++cl)
//    {
//        uint lid = 0;
//        uint hash_t_size = hash_t.l[cl].size();
//        for (; lid < hash_t_size; ++lid)
//        {
//            list<uint>::iterator itt = hash_t.l[cl][lid].begin();
//            //printf("l.id=%u it->size()=%lu\n", lid, hash_t.l[lid].size());
//            while (itt != hash_t.l[cl][lid].end())
//            {
//                HashPointer *t_hp = &(hash_t.hp.d[*itt]);
//                uint p_pnb = t_hp->pnb;
//                back_grab_vals(pnb.d[p_pnb].p_list, new_v, vals);
//
//                lsh.lsh(vals, cl, new_lsh_hash_code);
//                uint new_hash_code = hash_t.hash_from_lsh(new_lsh_hash_code);
//                //printf("new_lsh_hash_code=%d new_hash_code=%u\n", new_lsh_hash_code, new_hash_code);
//                //printf("(*itt)->lsh_hash_code=%d (*itt)->hash_code=%u\n", (*itt)->lsh_hash_code, (*itt)->hash_code);
//
//                if (memcmp(new_lsh_hash_code, t_hp->lsh_hash_code, sizeof(int) * K) == 0)
//                {
//                    // nothing needs to be done; move to next hash bucket
//                    ++itt;
//                }
//                else
//                {
//                    // lsh code has changed;
//                    //(*itt)->lsh_hash_code = new_lsh_hash_code;
//                    memcpy(t_hp->lsh_hash_code, new_lsh_hash_code, sizeof(int) * K);
//                    // put all entries in the nlist to the active list.
//                    if (!pnb.d[p_pnb].at_least_one_lsh_changed)
//                    {
//                        active_list.insert(active_list.end(),
//                                           (pnb.d[p_pnb].n_list).begin(), (pnb.d[p_pnb].n_list).end());
//                        pnb.d[p_pnb].at_least_one_lsh_changed = true;
//                    }
//                    if (new_hash_code != t_hp->hash_code)
//                    {
//                        // both lsh and hash_code have changed.
//                        // move to the new location
//                        // add to the new location
//                        hash_t.l[cl][hash_t.l_loc_from_hash(new_hash_code, cl)].push_back(*itt);
//                        // update its hash_code
//                        //uint old_hash_code = (*itt)->hash_code;
//                        (t_hp)->hash_code = new_hash_code;
//                        // remove it here
//                        itt = (hash_t.l[cl][lid]).erase(itt);
//                    }
//                    else
//                    {
//                        ++itt;
//                    }
//                }
//                //printf("end itt iter\n");
//            }
//        }
//    }
//    //inv.check_from_dfslist(num_items);
//
//    printf("merging hash buckets with the same lsh code in each column\n");
//    fflush(stdout);
//    //check_non_empty_item2hp();
//    merge_with_same_lsh();
//    //inv.check_from_dfslist(num_items);
//    //hash_t.print_hash_table(inv);
//
//    printf("deal with active_list\n");
//    //check_non_empty_item2hp();
//    // deal with active_list
//    sort(active_list.begin(), active_list.end());
//    vector<uint>::iterator active_list_last = unique(active_list.begin(),
//                                                     active_list.end());
//    vector<uint>::iterator active_elem;
//    for (active_elem = active_list.begin(); active_elem != active_list_last;
//         ++active_elem)
//    {
//        //printf("begin process_active_elem, active_elem=%u\n", *active_elem);
//        back_process_active_elem(*active_elem);
//        //check_non_empty_item2hp();
//        //printf("returned from process_active_elem\n");
//    }
//    //inv.check_from_dfslist(num_items);
//
//    printf("second time: merging hash buckets with the same lsh code in each column\n");
//    fflush(stdout);
//    merge_with_same_lsh();
//    //inv.check_from_dfslist(num_items);
//    //hash_t.print_hash_table(inv);
//
//    printf("assign new_v to old_v\n");
//    // move new_v to old_v
//    for (it = hash_t.l[0].begin(); it != hash_t.l[0].end(); ++it)
//    {
//        list<uint>::iterator itt;
//        for (itt = it->begin(); itt != it->end(); ++itt)
//        {
//            //int rep_x = (*itt)->p_list_x;
//            //int rep_y = (*itt)->p_list_y;
//            //old_v[rep_x][rep_y] = new_v[rep_x][rep_y];
//            //old_v[(*itt)->p_list] = new_v[(*itt)->p_list];
//            HashPointer *t_hp = &(hash_t.hp.d[*itt]);
//            assign_vals(new_v, pnb.d[t_hp->pnb].p_list, old_v, pnb.d[t_hp->pnb].p_list);
//        }
//    }
//}
//
//// incomplete version of using new hash_t and pnb
////void NanoVoidOneStep::prev() {
////    valueType vals[back_vals_len];
////    vector< uint > active_list;
////
////    printf("one-step-back-eval\n");
////    vector< list< uint > >::iterator it;
////    for (it = back_hash_t.l[0].begin(); it != back_hash_t.l[0].end(); ++ it) {
////        list< uint >::iterator itt;
////        for (itt = it->begin(); itt != it->end(); ++ itt) {
////            uint p_pnb = back_hash_t.hp.d[*itt].pnb;
////            back_grab_vals(back_pnb.d[p_pnb].p_list, back_old_v, vals);
////            backward_one_step(vals, back_pnb.d[p_pnb].p_list, back_new_v);
////            accumulate_weight_derivative(vals, back_pnb.d[p_pnb].p_list);
////            back_pnb.d[p_pnb].at_least_one_lsh_changed = false;
////        }
////    }
////    // compute change weight and add to final change
////
////    printf("move hash buckets across different hash_t.l entries\n");
////    int new_lsh_hash_code[K];
////    uint cl = 0;
////    for (cl = 0; cl < L; ++ cl) {
////        uint lid = 0;
////        uint hash_t_size = back_hash_t.l[cl].size();
////        for ( ; lid < hash_t_size; ++ lid) {
////            list< uint >::iterator itt = back_hash_t.l[cl][lid].begin();
////            //printf("l.id=%u it->size()=%lu\n", lid, hash_t.l[lid].size());
////            while (itt != back_hash_t.l[cl][lid].end()) {
////                HashPointer* t_hp = &(back_hash_t.hp.d[*itt]);
////                uint p_pnb = t_hp->pnb;
////                back_grab_vals(back_pnb.d[p_pnb].p_list, back_new_v, vals);
////
////                back_lsh.lsh(vals, cl, new_lsh_hash_code);
////                uint new_hash_code = back_hash_t.hash_from_lsh(new_lsh_hash_code);
////                //printf("new_lsh_hash_code=%d new_hash_code=%u\n", new_lsh_hash_code, new_hash_code);
////                //printf("(*itt)->lsh_hash_code=%d (*itt)->hash_code=%u\n", (*itt)->lsh_hash_code, (*itt)->hash_code);
////
////                if (memcmp(new_lsh_hash_code, t_hp->lsh_hash_code, sizeof(int)*K) == 0) {
////                    // nothing needs to be done; move to next hash bucket
////                    ++ itt;
////                }else{
////                    // lsh code has changed;
////                    //(*itt)->lsh_hash_code = new_lsh_hash_code;
////                    memcpy(t_hp->lsh_hash_code, new_lsh_hash_code, sizeof(int)*K);
////                    // put all entries in the nlist to the active list.
////                    if (!back_pnb.d[p_pnb].at_least_one_lsh_changed) {
////                        active_list.insert(active_list.end(),                       \
////                               (back_pnb.d[p_pnb].n_list).begin(), (back_pnb.d[p_pnb].n_list).end());
////                        back_pnb.d[p_pnb].at_least_one_lsh_changed = true;
////                    }
////                    if (new_hash_code != t_hp->hash_code) {
////                        // both lsh and hash_code have changed.
////                        // move to the new location
////                        // add to the new location
////                        back_hash_t.l[cl][back_hash_t.l_loc_from_hash(new_hash_code, cl)].push_back(*itt);
////                        // update its hash_code
////                        //uint old_hash_code = (*itt)->hash_code;
////                        (t_hp)->hash_code = new_hash_code;
////                        // remove it here
////                        itt = (back_hash_t.l[cl][lid]).erase(itt);
////                    }else{
////                        ++ itt;
////                    }
////                }
////                //printf("end itt iter\n");
////            }
////        }
////    }
////    //inv.check_from_dfslist(num_items);
////
////    printf("merging hash buckets with the same lsh code in each column\n");
////    fflush(stdout);
////    //check_non_empty_item2hp();
////    merge_with_same_lsh(); // need to rewrite
////    //inv.check_from_dfslist(num_items);
////    //hash_t.print_hash_table(inv);
////
////    printf("deal with active_list\n");
////    //check_non_empty_item2hp();
////    // deal with active_list
////    sort(active_list.begin(), active_list.end());
////    vector<uint>::iterator active_list_last = unique(active_list.begin(), \
////                                                   active_list.end());
////    vector<uint>::iterator active_elem;
////    for (active_elem = active_list.begin(); active_elem != active_list_last;
////         ++ active_elem) {
////        //printf("begin process_active_elem, active_elem=%u\n", *active_elem);
////        process_active_elem(*active_elem);
////        //check_non_empty_item2hp();
////        //printf("returned from process_active_elem\n");
////    }
////    //inv.check_from_dfslist(num_items);
////
////    printf("second time: merging hash buckets with the same lsh code in each column\n");
////    fflush(stdout);
////    merge_with_same_lsh();
////    //inv.check_from_dfslist(num_items);
////    //hash_t.print_hash_table(inv);
////
////    printf("assign new_v to old_v\n");
////    // move new_v to old_v
////    for (it = hash_t.l[0].begin(); it != hash_t.l[0].end(); ++ it) {
////        list< uint >::iterator itt;
////        for (itt = it->begin(); itt != it->end(); ++ itt) {
////            //int rep_x = (*itt)->p_list_x;
////            //int rep_y = (*itt)->p_list_y;
////            //old_v[rep_x][rep_y] = new_v[rep_x][rep_y];
////            //old_v[(*itt)->p_list] = new_v[(*itt)->p_list];
////            HashPointer* t_hp = &(hash_t.hp.d[*itt]);
////            assign_vals(new_v, pnb.d[t_hp->pnb].p_list, old_v, pnb.d[t_hp->pnb].p_list);
////        }
////    }
////    //inv.check_from_dfslist(num_items);
////}
//
//void NanoVoidOneStep::accumulate_weight_derivative(valueType *vals, uint c)
//{
//    valueType dt = 2e-2;
//    valueType mv = std::abs(p.diff_v0) * vals[0] / std::abs(p.kBT0);
//    valueType mi = std::abs(p.diff_i0) * vals[lap_len_2nd] / std::abs(p.kBT0);
//    valueType L = std::abs(p.L0);
//    valueType energy_v = std::abs(p.energy_v0);
//    valueType kBT = std::abs(p.kBT0);
//    valueType kappa_v = std::abs(p.kappa_v0);
//    valueType energy_i = std::abs(p.energy_i0);
//    valueType kappa_i = std::abs(p.kappa_i0);
//    valueType kappa_eta = std::abs(p.kappa_eta0);
//
//    // get size of this bucket
//    uint root_pd = inv.item2pd[c];
//    uint bucket_size = inv.d_size(root_pd);
//
//    // 1 - cv - ci
//    valueType one_cv_ci = 1 - vals[0] - vals[lap_len_2nd];
//    if (one_cv_ci < 1e-6)
//        one_cv_ci = 1e-6;
//
//    // energy v
//    valueType eta_1_sq[lap_len_1st];
//    for (uint i = 0; i < lap_len_1st; ++i)
//    {
//        eta_1_sq[i] = (vals[lap_len_2nd * 2 + i] - 1) * (vals[lap_len_2nd * 2 + i] - 1);
//    }
//    valueType dcv_dev = dt * mv * inner_product(eta_1_sq, lapw, lap_len_1st);
//    valueType dci_dev = 0.0;
//    valueType deta_dev = dt * (-L) * N * 2 * (vals[lap_len_2nd * 2] - 1) * vals[0];
//    dp.energy_v0 += bucket_size * (dcv_dev + dci_dev + deta_dev);
//
//    // energy i
//    valueType dcv_dei = 0.0;
//    valueType dci_dei = dt * mi * inner_product(eta_1_sq, lapw, lap_len_1st);
//    valueType deta_dei = dt * (-L) * N * 2 * (vals[lap_len_2nd * 2] - 1) * vals[lap_len_2nd];
//    dp.energy_i0 += bucket_size * (dcv_dei + dci_dei + deta_dei);
//
//    // kBT
//    valueType eta_1_sq_cv[lap_len_1st];
//    valueType eta_1_sq_ci[lap_len_1st];
//    for (uint i = 0; i < lap_len_1st; ++i)
//    {
//        eta_1_sq_cv[i] = eta_1_sq[i] * (log_with_mask_single(vals[0], EPS) - log_with_mask_single(one_cv_ci, EPS));
//        eta_1_sq_ci[i] = eta_1_sq[i] * (log_with_mask_single(vals[lap_len_2nd], EPS) - log_with_mask_single(one_cv_ci, EPS));
//    }
//    valueType dcv_dkBT = dt * mv * inner_product(eta_1_sq_cv, lapw, lap_len_1st);
//    valueType dci_dkBT = dt * mv * inner_product(eta_1_sq_ci, lapw, lap_len_1st);
//    valueType deta_dkBT = dt * (-L) * N * 2 * (vals[lap_len_2nd * 2] - 1) * (vals[0] * log_with_mask_single(vals[0], EPS) + vals[lap_len_2nd] * log_with_mask_single(vals[lap_len_2nd], EPS) + one_cv_ci * log_with_mask_single(one_cv_ci, EPS));
//    dp.kBT0 += bucket_size * (dcv_dkBT + dci_dkBT + deta_dkBT);
//
//    // kappa v
//    valueType dcv_dkappa_v = -dt * mv * inner_product(vals, laplapw, lap_len_2nd);
//    valueType dci_dkappa_v = 0.0;
//    valueType deta_dkappa_v = 0.0;
//    dp.kappa_v0 += bucket_size * (dcv_dkappa_v + dci_dkappa_v + deta_dkappa_v);
//
//    // kappa i
//    valueType dcv_dkappa_i = 0.0;
//    valueType dci_dkappa_i = -dt * mi * inner_product(vals + lap_len_2nd, laplapw, lap_len_2nd);
//    valueType deta_dkappa_i = 0.0;
//    dp.kappa_i0 += bucket_size * (dcv_dkappa_i + dci_dkappa_i + deta_dkappa_i);
//
//    // kappa eta
//    valueType dcv_dkappa_eta = 0.0;
//    valueType dci_dkappa_eta = 0.0;
//    valueType deta_dkappa_eta = dt * L * N * inner_product(vals + lap_len_2nd * 2, lapw, lap_len_1st);
//    dp.kappa_eta0 += bucket_size * (dcv_dkappa_eta + dci_dkappa_eta + deta_dkappa_eta);
//
//    // diff v
//    valueType eta_1_sq_eta_sq_cv[lap_len_1st];
//    for (uint i = 0; i < lap_len_1st; ++i)
//    {
//        eta_1_sq_eta_sq_cv[i] = eta_1_sq[i] * (energy_v + kBT * (log_with_mask_single(vals[0], EPS) - log_with_mask_single(one_cv_ci, EPS))) + vals[lap_len_2nd] * vals[lap_len_2nd] * 2 * (vals[0] - 1);
//    }
//    valueType dcv_ddiff_v = dt * vals[0] / kBT * (inner_product(eta_1_sq_eta_sq_cv, lapw, lap_len_1st) - kappa_v * inner_product(vals, laplapw, lap_len_2nd));
//    valueType dci_ddiff_v = 0.0;
//    valueType deta_ddiff_v = 0.0;
//    dp.diff_v0 += bucket_size * (dcv_ddiff_v + dci_ddiff_v + deta_ddiff_v);
//
//    // diff i
//    valueType dcv_ddiff_i = 0.0;
//    valueType eta_1_sq_eta_sq_ci[lap_len_1st];
//    for (uint i = 0; i < lap_len_1st; ++i)
//    {
//        eta_1_sq_eta_sq_ci[i] = eta_1_sq[i] * (energy_i + kBT * (log_with_mask_single(vals[lap_len_2nd], EPS) - log_with_mask_single(one_cv_ci, EPS))) + vals[lap_len_2nd] * vals[lap_len_2nd] * 2 * vals[lap_len_2nd];
//    }
//    valueType dci_ddiff_i = dt * vals[lap_len_2nd] / kBT * (inner_product(eta_1_sq_eta_sq_ci, lapw, lap_len_1st) - kappa_i * inner_product(vals + lap_len_2nd, laplapw, lap_len_2nd));
//    valueType deta_ddiff_i = 0.0;
//    dp.diff_i0 += bucket_size * (dcv_ddiff_i + dci_ddiff_i + deta_ddiff_i);
//
//    // L
//    valueType dcv_dL = 0.0;
//    valueType dci_dL = 0.0;
//    valueType fs = energy_v * vals[0] + energy_i * vals[lap_len_2nd] + kBT * (vals[0] * log_with_mask_single(vals[0], EPS) + vals[lap_len_2nd] * log_with_mask_single(vals[lap_len_2nd], EPS) + one_cv_ci * log_with_mask_single(one_cv_ci, EPS));
//    valueType fv = (vals[0] - 1) * (vals[0] - 1) + vals[lap_len_2nd] * vals[lap_len_2nd];
//    valueType deta_dL = -dt * N * (fs * 2 * (vals[lap_len_2nd * 2] - 1) + fv * 2 * vals[lap_len_2nd * 2] - kappa_eta * inner_product(vals + lap_len_2nd * 2, lapw, lap_len_1st));
//    dp.L0 += bucket_size * (dcv_dL + dci_dL + deta_dL);
//}
//
//void NanoVoidOneStep::encode_from_last_frame(valueType ***img, valueType ***dloss, valueType lsh_r)
//{
//
//    printf("value table reset\n");
//    delete old_v;
//    delete new_v;
//    old_v = new valueType[back_vals_table_size];
//    new_v = new valueType[back_vals_table_size];
//
//    printf("item2hp reset\n");
//
//    for (uint i = 0; i < num_items; ++i)
//    {
//        item2hp[i].clear();
//        for (uint j = 0; j < L; ++j)
//        {
//            set<uint> *empty_set = new set<uint>();
//            item2hp[i].push_back(*empty_set);
//        }
//    }
//
//    printf("pnb reset\n");
//    pnb = PNBucketBank();
//
//    printf("hash_t reset\n");
//    hash_t = HashTable(K, L);
//
//    printf("lsh reset\n");
//    lsh.reset(0.0001, 3, 10, back_vals_len);
//
//    printf("inv reset\n");
//    inv = UnionFindDelete(num_items);
//
//    back_on = 1;
//
//    Coordinate2d3c c(0, 0);
//    for (c.x = 0; c.x < size; ++c.x)
//    {
//        for (c.y = 0; c.y < size; ++c.y)
//        {
//            uint item_1 = c.to_item_c1(size, size * size);
//            old_v[item_1] = img[c.x][c.y][0];                   // cv
//            old_v[item_1 + num_items] = img[c.x][c.y][1];       // ci
//            old_v[item_1 + num_items * 2] = img[c.x][c.y][2];   // eta
//            old_v[item_1 + num_items * 3] = dloss[c.x][c.y][0]; // dloss_dcv
//            old_v[item_1 + num_items * 4] = dloss[c.x][c.y][1]; // dloss_dci
//            old_v[item_1 + num_items * 5] = dloss[c.x][c.y][2]; // dloss_deta
//        }
//    }
//
//    // inv
//    uint inv_size = (uint)num_items;
//    for (uint i = 0; i < inv_size; i++)
//    {
//        inv.makeset(i);
//    }
//
//    if (debug_on)
//        ;
//    //        inv.check_from_dfslist(num_items);
//
//    valueType vals[back_vals_len];
//    int item_lsh[K];
//    uint item_k = 0, item = 0;
//
//    uint item_vec[num_items];
//    for (item_k = 0; item_k < num_items; ++item_k)
//    {
//        item_vec[item_k] = item_k;
//    }
//    random_shuffle(item_vec, item_vec + num_items);
//
//    for (item_k = 0; item_k < num_items; ++item_k)
//    {
//        item = item_vec[item_k];
//        //printf("encode item=%u\n", item);
//
//        back_grab_vals(item, old_v, vals);
//        if (debug_on)
//        {
//            fflush(stdout);
//            cout << "vals: ";
//            for (int i = 0; i < back_vals_len; ++i)
//                cout << vals[i] << ", ";
//            cout << endl;
//        }
//
//        uint cl = 0;
//        // determine if can add to other pnb;
//        uint pnb_to_add = UINT_NULL;
//        for (cl = 0; cl < L; ++cl)
//        {
//            lsh.lsh(vals, cl, item_lsh);
//            cout << "k-lsh: ";
//            for (int i = 0; i < K; ++i)
//                cout << item_lsh[i] << ", ";
//            cout << endl;
//            uint hp_it = hash_t.find(item_lsh, cl);
//            if (hp_it != UINT_NULL)
//            {
//                pnb_to_add = hash_t.hp.d[hp_it].pnb;
//                break;
//            }
//        }
//
//        uint item_pd = inv.item2pd[item];
//        PNBucket *pn_it = NULL;
//        if (pnb_to_add != UINT_NULL)
//        {
//            // merge into this bucket
//            pn_it = &(pnb.d[pnb_to_add]);
//            uint ori_pn_plist = pn_it->p_list;
//            uint pn_pd = inv.item2pd[pn_it->p_list];
//            uint root = inv.union_(item_pd, pn_pd);
//            pn_it->p_list = inv.d_item(root);
//
//            if (pn_it->p_list != ori_pn_plist)
//            {
//                for (cl = 0; cl < L; ++cl)
//                {
//                    item2hp[pn_it->p_list][cl].clear();
//                    item2hp[pn_it->p_list][cl].insert(item2hp[ori_pn_plist][cl].begin(),
//                                                      item2hp[ori_pn_plist][cl].end());
//                    item2hp[ori_pn_plist][cl].clear();
//                }
//            }
//            // no need to update old_v (it is their accurate value).
//            merge_neighbor_into_n_list(item, pn_it);
//        }
//        else
//        {
//            pnb_to_add = pnb.new_elem();
//            pn_it = &(pnb.d[pnb_to_add]);
//            pn_it->p_list = item;
//            assert((pn_it->n_list).size() == 0);
//            merge_neighbor_into_n_list(item, pn_it);
//        }
//
//        for (cl = 0; cl < L; ++cl)
//        {
//            lsh.lsh(vals, cl, item_lsh);
//
//            uint hp_it = hash_t.find(item_lsh, cl);
//            if (hp_it == UINT_NULL)
//            {
//                uint hp_id = hash_t.hp.new_elem();
//                HashPointer *hp_it = &(hash_t.hp.d[hp_id]);
//                std::memcpy(hp_it->lsh_hash_code, item_lsh, sizeof(int) * K);
//                hp_it->hash_code = hash_t.hash_from_lsh(item_lsh);
//                hp_it->pnb = pnb_to_add;
//                hash_t.insert(hp_id, hp_it->hash_code, cl);
//                item2hp[pn_it->p_list][cl].insert(hp_id);
//            }
//        }
//
//        if (item % size == 0)
//        {
//            // printf("after processing %u items\n", item);
//            //hash_t.print_hash_table(inv);
//        }
//    }
//
//    inv.check_from_dfslist(this->num_items);
//    // complete version of using new hash_t and pnb
//    //    // inv
//    //    uint inv_size = (uint) num_items;
//    //    for (uint i = 0; i < inv_size; i++) {
//    //        back_inv.makeset(i);
//    //    }
//    //
//    //    valueType vals[back_vals_len];
//    //    int item_lsh[K];
//    //    uint item_k = 0, item = 0;
//    //
//    //    uint item_vec[num_items];
//    //    for (item_k = 0; item_k < num_items; ++ item_k) {
//    //        item_vec[item_k] = item_k;
//    //    }
//    //    random_shuffle(item_vec, item_vec + num_items);
//    //
//    //    for (item_k = 0; item_k < num_items; ++ item_k) {
//    //        item = item_vec[item_k];
//    //        //printf("encode item=%u\n", item);
//    //
//    //        back_grab_vals(item, back_old_v, vals);
//    //
//    //        uint cl = 0;
//    //        // determine if can add to other pnb;
//    //        uint pnb_to_add = UINT_NULL;
//    //        for (cl = 0; cl < L; ++ cl) {
//    //            back_lsh.lsh(vals, cl, item_lsh);
//    //
//    //            uint hp_it = back_hash_t.find(item_lsh, cl);
//    //            if (hp_it != UINT_NULL) {
//    //                pnb_to_add = back_hash_t.hp.d[hp_it].pnb;
//    //                break;
//    //            }
//    //        }
//    //
//    //        uint item_pd = back_inv.item2pd[item];
//    //        PNBucket* pn_it = NULL;
//    //        if (pnb_to_add != UINT_NULL) {
//    //            // merge into this bucket
//    //            pn_it = &(back_pnb.d[pnb_to_add]);
//    //            uint ori_pn_plist = pn_it->p_list;
//    //            uint pn_pd = back_inv.item2pd[pn_it->p_list];
//    //            uint root = back_inv.union_(item_pd, pn_pd);
//    //            pn_it->p_list = back_inv.d_item(root);
//    //
//    //            if (pn_it->p_list != ori_pn_plist) {
//    //                for (cl = 0; cl < L; ++ cl) {
//    //                    back_item2hp[pn_it->p_list][cl].clear();
//    //                    back_item2hp[pn_it->p_list][cl].insert(back_item2hp[ori_pn_plist][cl].begin(), \
////                                            back_item2hp[ori_pn_plist][cl].end());
//    //                    back_item2hp[ori_pn_plist][cl].clear();
//    //                }
//    //            }
//    //            // no need to update old_v (it is their accurate value).
//    //            merge_neighbor_into_n_list(item, pn_it);
//    //        }else{
//    //            pnb_to_add = back_pnb.new_elem();
//    //            pn_it = &(back_pnb.d[pnb_to_add]);
//    //            pn_it->p_list = item;
//    //            assert((pn_it->n_list).size() == 0);
//    //            merge_neighbor_into_n_list(item, pn_it);
//    //        }
//    //
//    //        for (cl = 0; cl < L; ++ cl) {
//    //            back_lsh.lsh(vals, cl, item_lsh);
//    //
//    //            uint hp_it = back_hash_t.find(item_lsh, cl);
//    //            if (hp_it == UINT_NULL) {
//    //                uint hp_id = back_hash_t.hp.new_elem();
//    //                HashPointer* hp_it = &(back_hash_t.hp.d[hp_id]);
//    //                std::memcpy(hp_it->lsh_hash_code, item_lsh, sizeof(int)*K);
//    //                hp_it->hash_code = back_hash_t.hash_from_lsh(item_lsh);
//    //                hp_it->pnb = pnb_to_add;
//    //                back_hash_t.insert(hp_id, hp_it->hash_code, cl);
//    //                back_item2hp[pn_it->p_list][cl].insert(hp_id);
//    //            }
//    //        }
//    //
//    //        if (item % size == 0) {
//    //            // printf("after processing %u items\n", item);
//    //            //hash_t.print_hash_table(inv);
//    //        }
//    //    }
//    //
//    //    back_inv.check_from_dfslist(this->num_items);
//}
//
//void NanoVoidOneStep::back_process_active_elem(uint active_elem)
//{
//    valueType vals[back_vals_len];
//    back_grab_vals(active_elem, new_v, vals);
//
//    uint root = inv.find_(inv.item2pd[active_elem]);
//    uint root_item = inv.d_item(root);
//    uint root_size = inv.d_size(root);
//
//    int active_elem_lsh[K];
//    uint cl = 0;
//    if (root_size == 1)
//    {
//        for (cl = 0; cl < L; ++cl)
//        {
//            if (item2hp[root_item][cl].size() > 1)
//            {
//                printf("process_active_elem:: item2hp[root_item][cl].size()=%lu > 1\n", item2hp[root_item][cl].size());
//                //assert(item2hp[root_item][cl].size() == 1);
//                set<uint>::iterator it = item2hp[root_item][cl].begin();
//                ++it;
//                while (it != item2hp[root_item][cl].end())
//                {
//                    HashPointer *hp_it = &(hash_t.hp.d[*it]);
//                    hash_t.move_out(*it, hp_it->lsh_hash_code, cl);
//                    hash_t.hp.free_elem(*it);
//                    it = item2hp[root_item][cl].erase(it);
//                }
//            }
//            uint root_hp_id = (*item2hp[root_item][cl].begin());
//            HashPointer *root_hp = &(hash_t.hp.d[root_hp_id]);
//
//            lsh.lsh(vals, cl, active_elem_lsh);
//
//            if (memcmp(active_elem_lsh, root_hp->lsh_hash_code, sizeof(int) * K) != 0)
//            {
//                uint active_elem_hash_code = hash_t.hash_from_lsh(active_elem_lsh);
//                if (active_elem_hash_code != root_hp->hash_code)
//                {
//                    hash_t.move_out(root_hp_id, root_hp->lsh_hash_code, cl);
//                    root_hp->hash_code = active_elem_hash_code;
//                    hash_t.insert(root_hp_id, active_elem_hash_code, cl);
//                }
//                memcpy(root_hp->lsh_hash_code, active_elem_lsh, sizeof(int) * K);
//            }
//        }
//    }
//    else
//    { // root_size > 1
//        // determine if pnb actually needs split
//        bool pnb_need_split = true;
//        for (cl = 0; cl < L; ++cl)
//        {
//            lsh.lsh(vals, cl, active_elem_lsh);
//
//            set<uint>::iterator root_hp_it = item2hp[root_item][cl].begin();
//            for (; root_hp_it != item2hp[root_item][cl].end(); ++root_hp_it)
//            {
//                HashPointer *root_hp = &(hash_t.hp.d[*root_hp_it]);
//                if (memcmp(active_elem_lsh, root_hp->lsh_hash_code, sizeof(int) * K) == 0)
//                {
//                    pnb_need_split = false;
//                    break;
//                }
//            }
//
//            if (!pnb_need_split)
//                break;
//        }
//
//        if (pnb_need_split)
//        {
//            pair<uint, uint> new_pd = inv.delete_(inv.item2pd[active_elem], root);
//            // automatically update root_size
//
//            // need update the item2bucket for root as well (since it may also change).
//            uint new_root_item = inv.d_item(new_pd.second);
//            set<uint>::iterator new_root_hp_it = item2hp[root_item][0].begin();
//            uint pnb_id = hash_t.hp.d[*new_root_hp_it].pnb;
//
//            if (new_root_item != root_item)
//            {
//                for (cl = 0; cl < L; ++cl)
//                {
//                    item2hp[new_root_item][cl].clear();
//                    item2hp[new_root_item][cl].insert(item2hp[root_item][cl].begin(),
//                                                      item2hp[root_item][cl].end());
//                    item2hp[root_item][cl].clear();
//                }
//                pnb.d[pnb_id].p_list = new_root_item;
//                //new_v[inv.d_item(new_pd.second)] = new_v[root_item];
//                assign_vals(new_v, root_item, new_v, new_root_item);
//            }
//
//            // take care of the n_list
//            move_out_neighbor_from_n_list(active_elem, &(pnb.d[pnb_id]));
//
//            // determine if the split node can be added to other pnb;
//            uint pnb_to_add = UINT_NULL;
//            for (cl = 0; cl < L; ++cl)
//            {
//                lsh.lsh(vals, cl, active_elem_lsh);
//
//                uint hp_it = hash_t.find(active_elem_lsh, cl);
//                if (hp_it != UINT_NULL)
//                {
//                    pnb_to_add = hash_t.hp.d[hp_it].pnb;
//                    break;
//                }
//            }
//
//            uint active_elem_pd = new_pd.first;
//            PNBucket *pn_it = NULL;
//            if (pnb_to_add != UINT_NULL)
//            {
//                // merge into this bucket
//                pn_it = &(pnb.d[pnb_to_add]);
//                uint ori_pn_plist = pn_it->p_list;
//                uint pn_pd = inv.item2pd[pn_it->p_list];
//                uint pn_root = inv.union_(active_elem_pd, pn_pd);
//                pn_it->p_list = inv.d_item(pn_root);
//
//                if (pn_it->p_list != ori_pn_plist)
//                {
//                    for (cl = 0; cl < L; ++cl)
//                    {
//                        item2hp[pn_it->p_list][cl].clear();
//                        item2hp[pn_it->p_list][cl].insert(item2hp[ori_pn_plist][cl].begin(),
//                                                          item2hp[ori_pn_plist][cl].end());
//                        item2hp[ori_pn_plist][cl].clear();
//                    }
//                }
//                merge_neighbor_into_n_list(active_elem, pn_it);
//                //new_v[pn_it->p_list] = new_v[ori_pn_plist];
//                assign_vals(new_v, ori_pn_plist, new_v, pn_it->p_list);
//            }
//            else
//            {
//                // build a new pnb;
//                pnb_to_add = pnb.new_elem();
//                pn_it = &(pnb.d[pnb_to_add]);
//                pn_it->p_list = active_elem;
//                assert((pn_it->n_list).size() == 0);
//                merge_neighbor_into_n_list(active_elem, pn_it);
//                //new_v[active_elem] = new_v[root_item];
//                assign_vals(new_v, root_item, new_v, active_elem);
//                for (cl = 0; cl < L; ++cl) // TODO: XYX: why do we need to clear this here??
//                    item2hp[active_elem][cl].clear();
//            }
//
//            //
//            for (cl = 0; cl < L; ++cl)
//            {
//                lsh.lsh(vals, cl, active_elem_lsh);
//
//                uint hp_it = hash_t.find(active_elem_lsh, cl);
//                if (hp_it == UINT_NULL || hash_t.hp.d[hp_it].pnb != pnb_to_add)
//                {
//                    uint new_hp_id = hash_t.hp.new_elem();
//                    HashPointer *new_hp = &(hash_t.hp.d[new_hp_id]);
//
//                    memcpy(new_hp->lsh_hash_code, active_elem_lsh, sizeof(int) * K);
//                    new_hp->hash_code = hash_t.hash_from_lsh(active_elem_lsh);
//                    new_hp->pnb = pnb_to_add;
//                    hash_t.insert(new_hp_id, new_hp->hash_code, cl);
//                    item2hp[pn_it->p_list][cl].insert(new_hp_id);
//                }
//            }
//        }
//        else
//        { // !pnb_need_split
//            for (cl = 0; cl < L; ++cl)
//            {
//                lsh.lsh(vals, cl, active_elem_lsh);
//
//                bool need_new_bucket = true;
//                set<uint>::iterator root_hp_it = item2hp[root_item][cl].begin();
//                uint pnb_id = hash_t.hp.d[*root_hp_it].pnb;
//                for (; root_hp_it != item2hp[root_item][cl].end(); ++root_hp_it)
//                {
//                    HashPointer *root_hp = &(hash_t.hp.d[*root_hp_it]);
//                    if (memcmp(active_elem_lsh, root_hp->lsh_hash_code, sizeof(int) * K) == 0)
//                    {
//                        need_new_bucket = false;
//                        break;
//                    }
//                }
//
//                uint hp_id = hash_t.find(active_elem_lsh, cl);
//                if (hp_id != UINT_NULL)
//                {
//                    //HashPointer* hp = &(hash_t.hp.d[hp_id]);
//                    if (hash_t.hp.d[hp_id].pnb == pnb_id)
//                        need_new_bucket = false;
//                }
//
//                if (need_new_bucket)
//                {
//                    uint new_hp_id = hash_t.hp.new_elem();
//                    HashPointer *new_hp = &(hash_t.hp.d[new_hp_id]);
//                    memcpy(new_hp->lsh_hash_code, active_elem_lsh, sizeof(int) * K);
//                    new_hp->hash_code = hash_t.hash_from_lsh(active_elem_lsh);
//                    new_hp->pnb = pnb_id;
//                    hash_t.insert(new_hp_id, new_hp->hash_code, cl);
//                    item2hp[root_item][cl].insert(new_hp_id);
//                }
//            }
//        }
//    }
//}
//
//void NanoVoidOneStep::print_derivative()
//{
//    // fflush(stdout);
//    cout << "derivative of weight: " << endl;
//    cout << "energy_v: " << dp.energy_v0 << endl;
//    cout << "energy_i: " << dp.energy_i0 << endl;
//    cout << "kBT: " << dp.kBT0 << endl;
//    cout << "kappa_v: " << dp.kappa_v0 << endl;
//    cout << "kappa_i: " << dp.kappa_i0 << endl;
//    cout << "kappa_eta: " << dp.kappa_eta0 << endl;
//    cout << "diff_v: " << dp.diff_v0 << endl;
//    cout << "diff_i: " << dp.diff_i0 << endl;
//    cout << "L: " << dp.L0 << endl;
//}
